Conteúdo principal
Curso: Estatística Avançada > Unidade 3
Lição 4: Efeitos das transformações linearesComo os parâmetros se alteram à medida que os dados são deslocados e redimensionados
Veja como a transformação de um conjunto de dados, por meio da soma, subtração, multiplicação ou divisão de/por uma constante, afeta as medidas de centro e de dispersão.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA14C Bom, estou com os dados aqui
em uma planilha. O tipo de planilha não importa. Você pode fazer isso
usando o Microsoft Excel, ou as planilhas do Google. Mas quero utilizar a planilha
para calcular alguns parâmetros. O que quero fazer aqui é
mostrar como esses parâmetros podem mudar quando alteramos os dados, por exemplo, quando deslocamos
os dados subtraindo ou somando o conjunto de dados
por alguma quantia. Ou quando mexemos
na escala dos dados, quando multiplicamos ou dividimos
os dados por algum valor. Quando fazemos isso,
alteramos os dados, como os parâmetros
vão se comportar? Quando falo de parâmetros, estou falando de coisas
como a média. Vou colocar aqui:
"média", "desvio padrão", "mediana", e intervalo interquartil,
que eu vou escrever como "IIQ". Vamos começar calculando a média. Só preciso colocar a fórmula aqui e selecionar os nossos dados. Enter. Ok, a média é esta: 6,16. E o que aconteceria
se nós deslocássemos esse conjunto de dados,
por exemplo, se adicionássemos +5
a todos os dados? Uma forma de fazer isso é
selecionar aqui +5. Agora, eu arrasto aqui. O que você acha que aconteceria
com a média se eu somasse +5? Isso mesmo, a média
se deslocaria também +5. Isso não deve ser
uma surpresa para nós porque somamos os números e os dividimos pela quantidade
de números somados. Se adicionamos +5
em todos os números, isso deve aparecer na média. E se, por acaso,
nós mexêssemos na escala, se nós multiplicássemos
nossos dados por 5? Vamos pegar aqui este dado
e multiplicar por 5. Vamos arrastar aqui. O que você acha que
vai acontecer com a média? Bom, ela também vai acompanhar,
seguindo a mesma lógica. Então, aqui tínhamos
uma média de 6. Agora, de aproximadamente 30. Ela acompanhou. Vamos fazer a mesma coisa com a nossa outra medida típica de tendência central,
a mediana. Vou escrever a fórmula aqui. Selecionar os nossos dados. A mediana nada mais é
do que o número central. Colocamos estes números aqui em ordem e selecionamos o número central. No caso aqui, é a média de dois números
que estão no centro, 5,5. Então, o que você acha que
vai acontecer com a mediana? Será que ela vai acompanhar também,
assim como a média? Vamos descobrir,
é só arrastar aqui. Sim, ela vai acompanhar! Podemos ver aqui que ela acompanhou
o deslocamento de +5. Ela também acompanhou
a mudança de escala, vezes 5. Então, para ambas essas
medidas de dispersão, tanto a média quanto a mediana, se você deslocar os números ou escalá-los, essas medidas vão acompanhar
essas alterações. Agora vamos ver o desvio padrão. A fórmula do desvio padrão
é esta aqui. Vamos selecionar nossos dados. Agora pause o vídeo e tente descobrir o que acontece com o desvio padrão. O que você acha que vai acontecer? Essa é uma medida de dispersão, então, se eu deslocar tudo
pela mesma quantia, a média se desloca, mas
as distâncias não se alteram. Certo? Então, o desvio padrão
não deve se alterar. Vamos conferir aqui? Assim como previsto,
o desvio padrão não se alterou. Mas e se nós mudássemos a escala? Se nós multiplicássemos tudo por 5, como o desvio padrão
iria se comportar? Já pensou? Eu acho que, nesse caso, vai mudar, porque, imagine um conjunto de dados com uma certa distância da média, mas que agora vão estar
5 vezes mais distantes, 5 vezes mais longe. Então, acho que o desvio padrão
vai seguir isso. Vamos dar uma olhada? Assim como previsto,
está 5 vezes maior. Agora, por último, vamos ver
um intervalo interquartil. Basicamente seria pegarmos
o terceiro quartil e subtraí-lo do primeiro quartil para descobrir a dispersão de 50%. Então, vamos fazer isso.
Vamos montar a fórmula aqui. Vamos colocar a fórmula aqui
no intervalo interquartil, que é esta aqui. Agora precisamos selecionar
nossos dados. Nós queremos fazer
o terceiro quartil menos o primeiro quartil. Vamos selecionar
os nossos dados novamente. Indicar que queremos
o primeiro quartil. Bom, isso deve dar conta.
Vamos ver? 2,75. Agora, você pode pausar o vídeo e pensar se o intervalo interquartil
deveria mudar. Tudo se deslocou, então,
o primeiro quartil será 5 a mais, e o terceiro quartil também. Aqui, para somar +5,
esse valor não deve mudar. Vamos ver? Não mudou. Como será que o intervalo interquartil vai se comportar com
a mudança de escala, quando nós multiplicamos vezes 5? O que você acha? Bom, nesse caso, acho que aí, sim, vai mudar alguma coisa, porque nós escalamos tudo vezes 5, os quartis também ficarão vezes 5, e sua distância deve
acompanhar essa mudança. Então, é bem provável que aqui
ele vai se alterar por um valor cinco vezes maior. Vamos ver? Assim como nós prevemos:
um valor 5 vezes maior. Resumindo, usei exemplos de deslocamento adicionando +5 de escala, fazendo vezes 5, mas eu poderia ter subtraído
por qualquer número, ou dividido por qualquer outro número. Estes aqui são só exemplos, ok? Eu poderia ter feito
outras contas aqui no lugar. Nós vimos que as medidas típicas
de tendência central, como a média e a mediana, à medida que deslocamos
nossos dados, à medida que mudamos
a escala dos dados, essas medidas também vão
acompanhar essas mudanças. Agora, em relação às medidas de dispersão, como o desvio padrão e
o intervalo interquartil, elas não mudam com o deslocamento,
como vimos aqui. No entanto, elas vão acompanhar
a mudança de escala.