If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Distribuição da amostragem da média amostral

O teorema de limite central e a distribuição da média da amostra. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] o último vídeo nós aprendemos aquela ideia é uma das mais profundas e estatística que é o teorema do limite central é a razão disso é tão interessante é que nós podemos iniciar com qualquer distribuição claro desde que tenha variância em média bem definidas então aqui tá média a variância digamos aqui o sigma quadrado então desvio-padrão né para calcular a variância só levar o desvio padrão ao quadrado então desde que eu tenha médio desvio padrão bem definidos não me importa o formato dessa distribuição o que eu posso pegar aqui no caso são amostras digamos no último vídeo peguei a morte de tamanho quatro igual a 4 aqui né daí eu calculei a média desses termos aqui nessas amostras ea média por exemplo a média 1 deu 2,75 aqui por exemplo até uma segunda amostra é o cálculo novamente a média amostral da 2ª mostra e depois eu continuo fazendo isso várias vezes o que é fascinante aqui no teorema do limite central é que se eu continuar marcando a freqüência dessas amostras aqui essas médias amostrais né isso começa a se aproximar de algo que parece com a distribuição normal olha aí e isso fica cada vez mais próximo da distribuição normal conforme se n aqui vai ficando maior conforme o iene cresce então o seguinte essa distribuição aqui de frequência às que eu comecei a pilotar aqui nessa aqui nessa aqui e aquela ali de cima também isso tudo aqui é chamado de que pode ser um pouco confuso quem está usando muitas vezes a palavra mostra né mas isso aqui é chamado de distribuição amostral e é uma distribuição postal de que é hora da média né da média amostral agora vamos estudar um pouquinho que isso daqui tudo significa quando eu falo distribuição a mostrar o que isso quer dizer que a distribuição de alguma estatística que nesse caso aqui aconteceu de ser o que a média amostral então cada pontinho desse aqui ele é uma mostra que entre aquelas amostras ali que eu peguei inicialmente então aqui eu tenho a primeira mostra o enem igual a 4 né eu estou usando aqui a estatística da média mas eu poderia até fazer outras coisas por exemplo poderia ter feito à moda ou intervalo ou qualquer outra estatística mas a distribuição amostral da média amostral é mais comum elas beleza dessa forma aqui pelo menos na minha mente é a maneira mais simples de começar a aprender sobre o teorema do limite central e ainda dá pra aprender também sobre a distribuição amostral eu vou mostrar pra vocês uma prova experimental isso aqui até porque eu penso que o experimental é até algo mais satisfatória estatística e isso aqui ó terá a mesma média do que essa média aqui de cima beleza vai ser exatamente a mesma média nós veremos aqui nos próximos vídeos que tudo isso daqui e irá se aproximar da distribuição normal mesmo que a minha distribuição a inicial não tenha sido uma distribuição normal quando eu faço a distribuição amostral das médias amostrais então eu tenho algo que se aproxima da distribuição normal eu vou fazer isso como eu disse de forma experimental e pra isso eu vou usar um aplicativo que tem no site online estética book ponto com é um site está em inglês mas dá pra gente lá acessar o aplicativo e ver como funciona vamos lá então olha só e bem aqui nesse aplicativo então eu consigo ver exatamente como funciona a distribuição amostral das médias amostrais eu vou fazer uma bagunça aqui e aí eu crio a minha própria distribuição customizada olha aí você pode usar isso daqui com uma função de densidade de probabilidades continuou discreta até nesse caso aqui ele me dá uma um alcance de 32 nessa forma que então determinei uma probabilidade para obter um desses 32 valores aqui certa então claramente que eu tenho aqui não é uma distribuição normal então eu quero fazer aqui é uma simulação para a gente entender melhor o que é essa distribuição amostral das médias amostrais então deixa eu começar aqui com o meu tamanho a mostrar ao dn igual a 5 e quando clicar aqui em animei de isso vai animar e vai mostrar como é que vai ficar essa distribuição das médias aqui olha só lá ele joga aqui como é que ficaria essa distribuição naquele gráfico das frequências não é que eu disse que se aproximaria da distribuição normal agora de fazer de novo vai funcionar e coloca mais uma vez a freqüência aqui onde caiu a frequência neste gráfico da distribuição das médias eu posso continuar fazendo isso aqui indefinidamente vai levar um certo tempo né mas eu posso fazer aqui pra facilitar minha vida posso fazer 10 mil desses espaços logo de uma vez ou 100 mil que esse programa faz aqui escolher números aleatórios dentro dessas probabilidades aqui foram dadas como inicialmente né então ele vai escolher cinco números por vez calcular sua média a média de cinco números e depois pilotar aqui neste gráfico da distribuição das médias o valor que eu obtive é esse eu clicar aqui por exemplo 10 mil vezes o que ele vai fazer é pegar 10 mil dessas amostras de cinco números calcular a média de cada uma delas e depois lutar aqui neste gráfico então vamos fazer isso 10 mil a opa olha aí como é que se parece mais com a distribuição normal e aí como eu disse a média original dessa distribuição louca que eu criei aqui é de 13,05 ea média aqui ó depois de ter feito 10 mil desses espaços está em 13,7 3 bem próximo daquele valor valor ali em cima né meu desvio padrão aqui em cima dessa distribuição louca de 10,14 e aqui embaixo olha só 4054 no vídeo futuro vou falar sobre essa diferença gritante aqui né e depois a gente tem um esquilo que a inclinação e cortou 6 que é curta 11 né essas aqui são coisas que nos ajudam a mensurar o quão normal essa distribuição aqui ó agora eu voltava para o editor de vídeo que eu quero falar um pouco mais sobre isso são conceitos que vão direto ao ponto esse negócio de inclinação da curva tosa então vamos lá então o esquilo é que a inclinação em dia seguinte se eu tenho aqui uma distribuição normal isso deveria ter uma assimetria que não é uma inclinação no caso skill de zero agora algo com uma assimetria né com a inclinação positiva seria algo parecido com isso aqui uma longa cauda indo para a direita então vou chamar de assimetria aqui né aqui seria uma assimetria positiva a simetria positiva e essa assimetria positiva que torna esse gráfico um pouco menos que o ideal para uma distribuição normal sim ou não e uma assimetria negativa como ficaria ela teria uma longa cauda aqui pra esquerda e aqui ela faria assim é certo então essa daqui ó seria o máximo ia negativa então se você tiver algum problema quem identificar basta ver a direção da cauda essa casa aqui ela tem na direção negativa então por isso que ela é negativa e essa aqui tem uma direção positiva por isso que ela é positiva então algo que não tem assimetria é algo perfeitamente simétricos sim ou não e aí se algo está perfeitamente simétrico em torno dessa média aqui então nós temos uma distribuição normal agora a palavra kurtov na palavra estranha aqui né esquisita cor tozzi só que ela é fácil de entender ou explicar agora que então que quer cortar 11 se eu tenho uma distribuição normal perfeita aqui lembrando que não é claro não existe uma distribuição normal perfeita não é perfeito e eu digo é que ela seja simétrico entorno aqui da média né pois ela pode ter desvio padrão diferente onde tem uma média diferente mas digamos que essa distribuição normal que eu acabei de desenhar seja uma distribuição uma perfeita então no caso aqui eu tiver uma cor tozzi positiva que vai acontecer não vai ficar assim ela vai ficar meio que pontuda nesse caso aqui ó tozzi positiva então algo que tem uma curta nota positiva dependendo do quão positivo isso é isso tite diz que isso será um pouco mais pontudo aqui pra cima portanto a corpore positiva longas caudas e um pico pontudo aqui em cima sim ou não e agora esse acordo for negativa horas é curta se for negativa caldas será menor mas ela será mais suave aqui assim ó terá mais ou menos dessa forma aqui ó beleza então isso daqui seria uma curta dose negativa então talvez no futuro os pobres daqui com mais detalhe mais para essa simulação aqui esses valores do esquilo cortou seis né que é a assimetria ea cor tozzi está apenas nos dizendo o quão normal essa distribuição aqui é e portanto quando nós fizemos dez repetições aqui né nós ficamos mais próximos à aquila a distribuição normal agora deixa eu fazer 100 mil repetições só para ver o que acontece o sem repetições ficou mais normal ainda esse gráfico sim ou não e aí você percebe o seguinte agora a nossa média é exatamente a mesma naquela média da distribuição maluca ofício n porém nós ainda temos um pouquinho aqui de assimetria e um pouquinho de cortar 11 agora vamos ver o que acontece se nós pegarmos o tamanho a mostrar maior maior que 5 ou fazer aqui em baixo pode fazer a comparação e aqui embaixo pegar média nec mim em inglês e aqui eu vou pegar um n igual a 25 aí a gente vai fazer ao mesmo tempo aqui o problema igual a 5 mil a 25 e ver o que acontece e vamos lá então agora vou ficar aqui em anime tarde ele vai pegar cinco aqui ó 5 a morte calcular a média depois 25 para calcular a média para esse aqui de baixo olha aí o que é legal vai tirar a média vai pilotar aqui ó acabou de fazer portanto aqui em cima tamanho mostrar assim aqui embaixo também mostrar 25 fazer mais uma vez daqui vamos lá 23 45 média nos três aí vai até 25 vai calcular a média e vai pilotar aqui neste gráfico de baixo vamos esperar pra ver a média que vai calcular que agora ó paí ó então pra isso aqui eu acabei de fazer eu vou fazer mais 10 mil vezes agora clicar aqui em 10 mil olha aí você vê quando a gente calcula a freqüência na distribuição das médias olha como é que fica bem parecido com a distribuição normal mas aqui você vai perceber o seguinte com esse m diferente aqui é 5 que é 25 repare que apesar das duas parecerem distribuições normais o skill e o cortou seis né que é a assimetria ea cor tozzi está menor aqui olha só se aproxima mais do zero então essa distribuição aqui domingo 25 é uma distribuição mais normal do que essa daqui de cima ou seja quando o tamanho a mostrar maior a distribuição das médias é mais normal do que quando também mostrar menor agora no futuro nós vamos ver também o seguinte é que apesar que mesmo que essa distribuição aqui seja mais normal que é de cima ela ainda por cima tem outra vantagem ela fica mais próxima que dá média ou seja quando o nosso tamanho mostrar maior a nossa probabilidade de nós ficarmos longe da média é menor é muito mais fácil ficar mais perto da média com também mostrou maior porque porque é muito menos provável que você pega uma mostra de 25 ou 100 amostras por exemplo calcula a média é essa média fique bem divergente né que divisa muito da média original já quando você pega o número pequeno se pode pegar números aqui aqui e aí a média vai ficar divergente não é ficar parecida com a média original já quando você pega bastante você vai pegar números aqui bem distribuídos e aí a média vai ficar bem parecida com a minha e original e agora eu te encoraja a entrar aqui no 11 lines techbox pontocom e brincar um pouquinho e se com esses gráficos aqui ver o que acontece mas eu queria dizer que é o seguinte conforme o tamanho amostral aumenta nós ficamos mais próximos de obter a distribuição normal até o próximo vídeo