Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 10
Lição 3: Distribuição de amostragem de uma média amostral- Inferências sobre a média da população a partir da média amostral
- Teorema central do limite
- Distribuição da amostragem da média amostral
- Distribuição da amostragem da média amostral (parte 2)
- Erro padrão da média
- Exemplo: Probabilidade de média amostral que excede um valor
- Média e desvio-padrão de médias amostrais
- Médias amostrais e o teorema central do limite
- Como calcular probabilidades com médias amostrais
- Exemplo de distribuição de amostragem de uma média amostral
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Distribuição da amostragem da média amostral
O teorema de limite central e a distribuição da média da amostra. Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] o último vídeo nós aprendemos aquela
ideia é uma das mais profundas e estatística que é o teorema do limite
central é a razão disso é tão interessante é que nós podemos iniciar
com qualquer distribuição claro desde que tenha variância em média bem
definidas então aqui tá média a variância digamos
aqui o sigma quadrado então desvio-padrão né
para calcular a variância só levar o desvio padrão ao quadrado
então desde que eu tenha médio desvio padrão bem definidos não me importa o
formato dessa distribuição o que eu posso pegar aqui no caso são amostras
digamos no último vídeo peguei a morte de tamanho quatro igual a 4 aqui né
daí eu calculei a média desses termos aqui nessas amostras ea média por
exemplo a média 1 deu 2,75 aqui por exemplo até uma segunda amostra
é o cálculo novamente a média amostral da 2ª mostra e depois eu continuo
fazendo isso várias vezes o que é fascinante aqui no teorema do limite
central é que se eu continuar marcando a freqüência dessas amostras aqui essas
médias amostrais né isso começa a se aproximar de algo que
parece com a distribuição normal olha aí e isso fica cada vez mais próximo da
distribuição normal conforme se n aqui vai ficando maior conforme o iene cresce
então o seguinte essa distribuição aqui de frequência às que eu comecei a
pilotar aqui nessa aqui nessa aqui e aquela ali de cima também isso tudo
aqui é chamado de que pode ser um pouco confuso quem está usando muitas vezes a
palavra mostra né mas isso aqui é chamado de distribuição
amostral e é uma distribuição postal de que é hora da média né da média amostral
agora vamos estudar um pouquinho que isso daqui tudo significa quando eu falo
distribuição a mostrar o que isso quer dizer que a distribuição de alguma
estatística que nesse caso aqui aconteceu de ser o que a média amostral
então cada pontinho desse aqui ele é uma mostra que entre aquelas amostras ali
que eu peguei inicialmente então aqui eu tenho a primeira mostra o enem igual a 4
né eu estou usando aqui a estatística da
média mas eu poderia até fazer outras coisas por exemplo poderia ter feito à
moda ou intervalo ou qualquer outra estatística mas a distribuição amostral
da média amostral é mais comum elas beleza dessa forma aqui pelo menos
na minha mente é a maneira mais simples de começar a aprender sobre o teorema do
limite central e ainda dá pra aprender também sobre a distribuição amostral eu
vou mostrar pra vocês uma prova experimental
isso aqui até porque eu penso que o experimental é até algo mais
satisfatória estatística e isso aqui ó terá a mesma média do que essa média
aqui de cima beleza vai ser exatamente a mesma média
nós veremos aqui nos próximos vídeos que tudo isso daqui e irá se aproximar da
distribuição normal mesmo que a minha distribuição a inicial
não tenha sido uma distribuição normal quando eu faço a distribuição amostral
das médias amostrais então eu tenho algo que se aproxima da distribuição normal
eu vou fazer isso como eu disse de forma experimental e pra isso eu vou usar um
aplicativo que tem no site online estética book ponto com é um site está
em inglês mas dá pra gente lá acessar o aplicativo e ver como funciona vamos lá
então olha só e bem aqui nesse aplicativo então eu consigo ver
exatamente como funciona a distribuição amostral das médias amostrais eu vou
fazer uma bagunça aqui e aí eu crio a minha própria distribuição customizada
olha aí você pode usar isso daqui com uma função de densidade de
probabilidades continuou discreta até nesse caso aqui ele me dá uma um alcance
de 32 nessa forma que então determinei uma probabilidade para obter um desses
32 valores aqui certa então claramente que eu tenho aqui não é uma distribuição
normal então eu quero fazer aqui é uma simulação para a gente entender melhor o
que é essa distribuição amostral das médias amostrais
então deixa eu começar aqui com o meu tamanho a mostrar ao dn igual a 5 e
quando clicar aqui em animei de isso vai animar e vai mostrar como é que vai
ficar essa distribuição das médias aqui olha só
lá ele joga aqui como é que ficaria essa distribuição naquele gráfico das
frequências não é que eu disse que se aproximaria da distribuição normal agora
de fazer de novo vai funcionar e coloca mais uma vez a freqüência aqui onde
caiu a frequência neste gráfico da distribuição das médias eu posso
continuar fazendo isso aqui indefinidamente vai levar um certo tempo
né mas eu posso fazer aqui pra facilitar
minha vida posso fazer 10 mil desses espaços logo de uma vez ou 100 mil que
esse programa faz aqui escolher números aleatórios
dentro dessas probabilidades aqui foram dadas como inicialmente né
então ele vai escolher cinco números por vez calcular sua média a média de cinco
números e depois pilotar aqui neste gráfico da distribuição das médias o
valor que eu obtive é esse eu clicar aqui por exemplo 10 mil vezes o que ele
vai fazer é pegar 10 mil dessas amostras de cinco números calcular a média de
cada uma delas e depois lutar aqui neste gráfico então vamos fazer isso 10 mil a
opa olha aí como é que se parece mais com a distribuição normal
e aí como eu disse a média original dessa distribuição louca que eu criei
aqui é de 13,05 ea média aqui ó depois de ter feito 10 mil desses espaços está
em 13,7 3 bem próximo daquele valor valor ali em cima né meu desvio padrão
aqui em cima dessa distribuição louca de 10,14
e aqui embaixo olha só 4054 no vídeo futuro vou falar sobre essa diferença
gritante aqui né e depois a gente tem um esquilo que a inclinação e cortou 6 que
é curta 11 né essas aqui são coisas que nos ajudam a
mensurar o quão normal essa distribuição aqui ó
agora eu voltava para o editor de vídeo que eu quero falar um pouco mais sobre
isso são conceitos que vão direto ao ponto
esse negócio de inclinação da curva tosa então vamos lá então o esquilo é que a
inclinação em dia seguinte se eu tenho aqui uma distribuição normal
isso deveria ter uma assimetria que não é uma inclinação no caso skill de zero
agora algo com uma assimetria né com a inclinação positiva seria algo parecido
com isso aqui uma longa cauda indo para a direita
então vou chamar de assimetria aqui né aqui seria uma assimetria positiva a
simetria positiva e essa assimetria positiva que torna esse gráfico um pouco
menos que o ideal para uma distribuição normal sim ou não e uma assimetria
negativa como ficaria ela teria uma longa cauda aqui pra
esquerda e aqui ela faria assim é certo então essa daqui ó seria o máximo
ia negativa então se você tiver algum problema quem identificar basta ver a
direção da cauda essa casa aqui ela tem na direção
negativa então por isso que ela é negativa e essa aqui tem uma direção
positiva por isso que ela é positiva então algo que não tem assimetria é algo
perfeitamente simétricos sim ou não e aí se algo está perfeitamente simétrico em
torno dessa média aqui então nós temos uma distribuição normal
agora a palavra kurtov na palavra estranha aqui né esquisita cor tozzi
só que ela é fácil de entender ou explicar agora que então que quer cortar
11 se eu tenho uma distribuição normal
perfeita aqui lembrando que não é claro não existe uma distribuição normal
perfeita não é perfeito e eu digo é que ela seja simétrico entorno aqui da média
né pois ela pode ter desvio padrão diferente onde tem uma média diferente
mas digamos que essa distribuição normal que eu acabei de desenhar seja uma
distribuição uma perfeita então no caso aqui eu tiver uma cor
tozzi positiva que vai acontecer não vai ficar assim ela vai ficar meio que
pontuda nesse caso aqui ó tozzi positiva então algo que tem uma curta nota
positiva dependendo do quão positivo isso é isso tite diz que isso será um
pouco mais pontudo aqui pra cima portanto a corpore positiva longas
caudas e um pico pontudo aqui em cima sim ou não
e agora esse acordo for negativa horas é curta se for negativa caldas será menor
mas ela será mais suave aqui assim ó terá mais ou menos dessa forma aqui ó
beleza então isso daqui seria uma curta dose negativa então talvez no futuro os
pobres daqui com mais detalhe mais para essa simulação aqui esses valores do
esquilo cortou seis né que é a assimetria ea cor tozzi está apenas nos
dizendo o quão normal essa distribuição aqui é e portanto quando nós fizemos dez
repetições aqui né nós ficamos mais próximos à aquila a
distribuição normal agora deixa eu fazer 100 mil repetições só para ver o que
acontece o sem repetições ficou mais normal ainda esse gráfico sim ou não e
aí você percebe o seguinte agora a nossa média é exatamente a mesma
naquela média da distribuição maluca ofício n
porém nós ainda temos um pouquinho aqui de assimetria e um pouquinho de cortar
11 agora vamos ver o que acontece se nós
pegarmos o tamanho a mostrar maior maior que 5 ou fazer aqui em baixo pode fazer
a comparação e aqui embaixo pegar média nec mim em inglês
e aqui eu vou pegar um n igual a 25 aí a gente vai fazer ao mesmo tempo aqui o
problema igual a 5 mil a 25 e ver o que acontece e vamos lá então agora vou
ficar aqui em anime tarde ele vai pegar cinco aqui ó 5 a morte calcular a média
depois 25 para calcular a média para esse aqui de baixo olha aí o que é legal
vai tirar a média vai pilotar aqui ó acabou de fazer
portanto aqui em cima tamanho mostrar assim aqui embaixo também mostrar 25
fazer mais uma vez daqui vamos lá 23 45 média nos três aí vai até 25 vai
calcular a média e vai pilotar aqui neste gráfico de baixo
vamos esperar pra ver a média que vai calcular que agora ó paí ó
então pra isso aqui eu acabei de fazer eu vou fazer mais 10 mil vezes agora
clicar aqui em 10 mil olha aí você vê quando a gente calcula a
freqüência na distribuição das médias olha como é que fica bem parecido com a
distribuição normal mas aqui você vai perceber o seguinte com esse m diferente
aqui é 5 que é 25 repare que apesar das duas parecerem
distribuições normais o skill e o cortou seis né que é a assimetria ea cor tozzi
está menor aqui olha só se aproxima mais do zero
então essa distribuição aqui domingo 25 é uma distribuição mais normal do que
essa daqui de cima ou seja quando o tamanho a mostrar maior
a distribuição das médias é mais normal do que quando também mostrar menor agora
no futuro nós vamos ver também o seguinte é que apesar que mesmo que essa
distribuição aqui seja mais normal que é de cima ela ainda por cima tem outra
vantagem ela fica mais próxima que dá média ou seja quando o nosso tamanho
mostrar maior a nossa probabilidade de nós ficarmos longe da média é menor
é muito mais fácil ficar mais perto da média com também mostrou maior porque
porque é muito menos provável que você pega uma mostra de 25 ou 100 amostras
por exemplo calcula a média é essa média fique bem divergente né que divisa
muito da média original já quando você pega o número pequeno se
pode pegar números aqui aqui e aí a média vai ficar divergente não é ficar
parecida com a média original já quando você pega bastante você vai
pegar números aqui bem distribuídos e aí a média vai ficar bem parecida com a
minha e original e agora eu te encoraja a entrar aqui no 11 lines techbox
pontocom e brincar um pouquinho e se com esses gráficos aqui ver o que acontece
mas eu queria dizer que é o seguinte conforme o tamanho amostral aumenta
nós ficamos mais próximos de obter a distribuição normal até o próximo vídeo