If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:9:44

Análise e visão por que dividimos por n-1 para a variância da amostra imparcial

Transcrição de vídeo

o que eu pretendo com este vídeo é dar uma ideia intuitiva de porque nós dividimos por e menos um quando vamos calcular a variância amostral vamos então pensar sobre uma população vamos supor aqui uma certa população cujo tamanho é dn maiúsculo elementos e vamos supor que nós vamos tomar uma amostra indicada por n minúsculo para a quantidade de elementos vamos pensar primeiro na média a média para a população a média é um parâmetro a média populacional é um parâmetro parâmetro refere-se à população para a mostra nós estamos falando quando estamos calculando a média mostrou dilma estatística quando nos referimos à mostra estamos falando de uma estatística para calcular a média da população indicada pela letra grega me nós tomamos a somatória com isso indo 1 até o n maiúsculo de todos os elementos x da população ou seja x 1 + 1 x 2 mas o x3 todos os elementos da população e depois de somadas de obter essa soma nós dividimos o resultado por m maiúsculo que a quantidade de elementos da população para a média amostral nós indicamos por x barra a média amostral e ela é obtida de maneira bastante similar à somatória com um indo de 1 até ele minúsculo que a quantidade de elementos da amostra de todos os termos xx 1 x 2 até os x em minúsculo dividido pela quantidade de elementos da amostra ou seja ele é minúsculo e a variância a variância é indicada pela letra grega sigma ao quadrado e é a média dos quadrados das diferenças entre cada elemento ea média da população então neste caso seria tomar a somatória com isso indo de 1 até m maiúsculo de cada elemento deles subtraindo a média da população que eu me elevada ao quadrado e depois de tudo isso dividindo o resultado pelo número de elementos da população que a m maiúsculo lembrando que a variância indica é uma medida pra usada para indicar o quão dispersos estão os dados em relação à média uma forma de medir essa dispersão e para a mostra bem existem várias maneiras de abordar a variância amostral existem várias maneiras com as quais as pessoas abordam a variância amostral uma dessas maneiras é o que nós chamamos de variância para uma amostra viciada para calcular a variância de uma mostra viciada nós indicamos por s quadrado e com o subíndice n e nós fazemos a conta bem similar à conta da variância populacional ou seja a somatória com o i indo de 1 até em minúsculo que é o número de elementos da amostra da diferença entre cada termo ea média amostral x barra medical amostral elevada ao quadrado e depois tudo / e minúsculo que é o número de elementos da amostra dessa forma calculamos a variância para uma mostra que dizemos viciada nós estamos aqui tentando escrever a variância para uma mostra não viciada como nós vamos fazer isso no último vídeo nós tentamos desenvolver um pouco a idéia de que para obter a variância de uma mostra não viciada nós indicamos por s - um quadrado e fazemos a somatória bem parecida porém nós dividimos a soma por n menos um e não por ele ou seja somatória com indo de um atm tom dos elementos do x e - a média mostrou tudo elevada ao quadrado e depois / n - 1 e é aí que nós vamos discutir um pouquinho s/n - um podemos começar percebendo que ao dividir por um número menor o enem - um é um número menor que o n que nós tínhamos aqui nós vamos então obter um resultado naturalmente maior o resultado para a variância vai ser um número maior que seu divide-se por n simplesmente esta aqui é o que nós chamamos de estimativa não viciada a estimativa não viciada mas aqui estamos falando então da estimativa viciada a variância para a estimativa não viciada normalmente indicado simplesmente indicada simplesmente por s quadrado vamos pensar um pouco mais sobre por que dividir por ele - 1 nos dá uma variância estimativamente melhor em relação a variância populacional que é a variância envolvendo o cálculo com todos os elementos da população vamos imaginar todos os dados da população todos os valores em uma reta numerada aqui eu tenho a minha reta numerada vamos supor aqui todos os dados da minha população nessa reta numérica todos os valores aqui aqui tem alguns aqui tem outros aqui tenho mais alguns aqui e aqui neste caso eu tenho 1 2 3 4 5 6 7 8 9 10 11 12 13 14 elementos na minha população neste caso o n maiúsculo que é o número de elementos da população é 14 vamos supor que a média da minha população não vou fazer exatamente esteja por exemplo por aqui essa é a média real a média populacional vamos supor que na minha amostra tenha três elementos em minúscula 3 vamos supor que eu tome por exemplo aleatoriamente este elemento este elemento e este elemento bem a média entre esses três parece estar razoavelmente próxima a média populacional aqui seria a média amostral podemos imaginar aqui também uma situação diferente com estes três elementos aqui e este este e este neste caso não é difícil de imaginar que a média amostral estaria por exemplo por aqui e para obter a variância nós temos que pegar a distância entre cada ponto ea média e levaram ao quadrado dividir pelo número de elementos é evidente que essas instâncias aqui em relação a metas são muito pequenas e ao calcular a variância por este caminho nós vamos obter um resultado muito menor que é de é que a variância original veja distância que temos dos pontos até a média é muito maior que o que vemos aqui ou seja calculando a variância em cima desses três elementos a variância de uma estimativa viciada nós estamos subestimando a variância real é um valor menor do que a variação real distância entre os elementos ea média populacional é uma subestimativa quando dividimos por ele então nós estamos subir estimando a variância ao dividir por ele - um que é um número menor nós vamos obter uma variância mostrar o maior que é uma estimativa melhor para imaginarmos a variância populacional no próximo usando um programa de computador vamos analisar por que dividir por ele - um dá para a variância amostral uma estimativa melhor para a variância populacional é isso aí estude bastante e até o próximo
AP® é uma marca comercial registrada da College Board, que não revisou este recurso.