If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Diferença de distribuição amostral da média

Neste vídeo, explicamos a diferença da distribuição de médias amostrais. Versão original criada por Sal Khan.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] eu quero construir um pouquinho melhor do que eu fiz no último vídeo então digamos que eu tenha duas variáveis aleatórias aqui então eu tenho uma das variáveis x eu vou desenhar aqui agora a distribuição normal dessa variável aleatória não sabe se é normal mas eu vou desenhar como se fosse uma distribuição normal aqui está a média né a média populacional dessa minha variável aleatória x e tem um certo tipo de desvio padrão que na verdade eu vou escrever como se fosse aqui a variância então a variância dessa variável aleatória x essa aqui então é a distribuição para nossa variável x e vamos dizer também que a gente tem outra variável aleatória que a variável y e eu vou desenhar agora que uma distribuição para essa variável y também vamos desenhar como se fosse uma distribuição normal mesma coisa que fizemos do x e aí fazer os mesmos parâmetros só tem uma média populacional aqui pra essa nossa variável econômica e y o caso e tem também uma variância nessa variável econômica y é ou não é e mais uma vez eu friso aqui que essas distribuições elas não precisam ser normais na verdade pode ser qualquer tipo de distribuição depois a gente vai aplicar o teorema de limite central pois a gente vai pegar várias amostras e calcular a média e aí o teorema do limite central vai se aplicar agora vamos pensar sobre a distribuição mostrar dessas variáveis randômicas aqui portanto é a distribuição distribuição amostral da média mostrar ao the xx e aí vamos dizer que o nosso tamanho mostrou aqui nosso tamanho amostral seja igual à m nesse caso nós vamos considerar o enem como sendo o número de amostras bem razoável bem grande então quando a desenhar essa distribuição ela vai se aproximar bastante de uma distribuição normal tranquilo já vimos isso em vários outros vídeos na verdade eu vou desenhar esse gráfico um pouco mais estreito a gente viu o teorema do limite central que é isso que acontece na verdade o que acontece fora o dia o padrão ele se torna menor conforme ele também mostrou que ele vai crescendo é um é aqui então vai ter a nossa média dessa distribuição aqui e essa média aqui eu vou colocar como notação a média do x com uma barra em cima porque a média das médias amostrais sakineh e nós sabemos de vários vídeos anteriores que essa média aqui ela vai ter o mesmo valor daquela média populacional lá de cima da distribuição original nós sabemos também do limite o tema central que a variância dessa distribuição mostrou aqui também chamada de erro padrão da média vai ser igual a quanto hora vai ser igual a variância da população original ali né então variância aquela variável aleatória x / esse valor do eneac beleza só botar o eniac de uma outra cor fica mais fácil depois de visualizar o enem vai ser essa cor aqui ó pra você calcular o desvio-padrão basta estar aí a raiz quadrada que em ambos os lados beleza vamos fazer agora a mesma coisa pra essa nossa variável randômica y aqui então vamos desenhar a distribuição amostral de yy com a barriga em cima porque são as médias amostrais aqui a distribuição amostral das meias amostragem da variável y agora vamos escrever essa distribuição aqui com também mostrou diferente vamos dizer que o tamanho amostral dessa distribuição das mesmas amostragem do y o tamanho amostral seja diferente na verdade não precisa ser diferente só vou mostrar que serve também quando também mostrar diferente o chão está a mostrar aqui dm então vou desenhar essa distribuição e que também a distribuição normal também estreitinha que assim né e aqui vai tá a média da nossa distribuição mostrar ao das mulheres a mostrar só quebrou y beleza e essa média aqui vai ser a mesma média dessa distribuição original da população original aqui então vai ser a média da nossa variável y e agora a variância disso aqui a ans também posso chamar de erro padrão da média na verdade eu acabei falando errado tá erro padrão da média seria a raiz quadrada isso daqui é ou não é que eu tenha variância não desvio padrão então isso daqui é simplesmente a variância na média não é o erro padrão na média beleza mesmo padrão tem a ver com desvio padrão e essa variante aqui ela vai ser a mesma coisa que sakineh vai ser a variância aquela distribuição original da população em cima né então vamos lá ver se aquela variância ali / esse tamanho amostral m e tudo isso daqui que nós fizemos até agora foi puramente uma revisão eu só fiz com duas variáveis diferente em uma razão para fazer isso porque agora eu vou definir uma nova variável aleatória e essa nova variável eu vou chamar dizer e esses e ele vai ser igual à diferença das duas médias a mostrar as nossas outras duas variáveis então só permanecer com a mesma cor vou colocar aqui usei é igual à x barra - o y barra isso aqui ó essa é a definição da nossa variável aleatória nossa nova variável aleatória z agora o que isso significa ora eu calcular uma média mostrou aqui né eu pego digamos um tamanho mostrar ao senhor a 10 dessa distribuição aqui e calcula essa média e essa média amostral ela é uma variável aleatória também porque hora imagine que você pegue 10 amostra dessa distribuição que eu fui à média essa média de 9,2 e essa média calculada ela vai ser uma mostra dessa outra distribuição aqui é um é a mesma coisa acontece para isso aqui pro y digamos que nós pegamos aqui um emmy igual a doze então 12 amostras ea gente calcula a média e essa média de 15,2 esse 15,2 essa média aqui ela pode ser vista como uma mostra dessa outra distribuição que a distribuição mostrado as médias amostrais da variável randômica y então o que que é o z hora usei nada mais é que uma variável aleatória que pode ser explicada da seguinte maneira eu vou pegar primeiro e mostras a primeira distribuição calcular média isso vai ser x barra depois eu faço a mesma coisa que pego m a mostra de distribuição calcula a média e depois o cálculo a diferença entre essas duas médias isso é o z e então você vai ser outra variável aleatória pra gente e agora tem algumas coisinhas que a gente já sabe a respeito do z que nós deduzimos no vídeo anterior ora a média dessa distribuição o que vou fazer para o z-4 ser descrita como sendo a média do x barra então essa é a média do x barra - o y barra certo e isso aqui eu posso escrever ainda como sendo o que você lembra do vídeo anterior que isso é a média amostral aqui da variável aleatória x - a média amostral do y certo isso daqui a gente viu no vídeo anterior foi uma das coisas que nós deduzimos é um é isso pode parecer um pouco abstrato nesse momento mas no próximo vídeo a gente já começa a fazer alguns exemplos com números aí fica mais tranqüilo fica mais fácil de você entender mas o grande ponto do vídeo é o seguinte você perceber que você pode fazer algumas estatísticas diferenciais a respeito de diferenças de médias o comparecido às são duas médias amostrais aqui há uma chance aleatória ou não a uma chance aleatória o que é um intervalo de confiança para uma diferença de médias é isso que nós estamos construindo nesse vídeo e agora vai ser a variância dessa distribuição sehac a variância da distribuição z que a mesma coisa que x barra - y barra eu posso escrever como sendo a variância dx da - o y barra e isso vai ser igual a quanto no último vídeo também nós vimos que a variância da diferença das médias é igual à soma e não há diferença das variâncias de cada uma delas então isso daqui vai ser igual à soma das variâncias de cada uma dessas médias a aliança da x barra mais a variância do y barra agora deixa eu desenhar aqui como ficaria essa distribuição a distribuição a respeito dessa nossa nova variável usei aqui ora essa distribuição ela também seria uma distribuição normal a primeira que a média dela né a média seria a média de x barra - o y barra e como a gente já viu essa média aqui é igual à diferença dessas outras duas médias beleza acabamos de ver isso agora deixa eu desenhar a curva que vai representar essa distribuição repare que essa curva é mais gordinha que as outras as outras são mais estreitas aqui é mais larga e porque eu tô fazendo isso daqui ora porque a variância aqui é igual à soma das outras duas variantes olha aí logo esse fato vai me tornar essa curva que um pouco mais larga que as outras duas pois é uma soma de variância né quando eu somos variâncias obviamente estou somando também devia os padrões logo isso aqui fica mais gordinho então aqui eu voltei a variância de x barra - y barra agora o que que é isso aqui em termos daquela distribuição da população original ora nós calculamos isso bem aqui em cima tá aqui ó certo ou seja nós sabemos que isso aqui é a mesma coisa que a variância da população original / n pelo tamanho mostrao nós já fizemos isso muitas e muitas e muitas vezes é ou não é então vamos reescrever isso daqui então vai ser igual a variância da nossa distribuição populacional e você percebe que esse xis aqui ele não tem uma barra pois ele não é a das médias a mostrar a ele apenas a variável econômica que nós pegamos naquela população original e isso dividido pelo tamanho amostral só não pode confundir essa variante aqui com essa variante aqui do x barra tá essa que é a variância da distribuição mostrou das médias a moça mas essa não é essa aqui é a variância da população à distribuição populacional e agora isso aqui eu posso fazer então da mesma forma vou usar que o azul certo isso aqui é a mesma coisa que isso aqui ó é ou não é olha aí então vou escrever isso como sendo igual a soma é que eu vou ter uma soma da variância daquele y da população original na distribuição populacional não é esse y barra cuidado dividido então por m que é o tamanho mostrou considerado e isso aqui então é a variância da diferença das médias a mostrar certa agora se você quiser saber o valor da do desvio padrão dessa distribuição aqui isso aqui é só você calcular então a raiz quadrada é ou não é então a raiz quadrada dessa variância vai ser o desvio-padrão desvio padrão das da diferença das meias a mostrar isso vai ser igual a raiz quadrada disso aqui ó ou seja da variância da distribuição populacional dividido pelo também mostrou n mas a variância da distribuição populacional daquela variável y dividido pelo tamanho mostrou dela que a emi ea razão pela qual fiz isso daqui é que isso me parece bem legal olha só vez isso daqui não parece com aquela forma da distância na verdade eu voltar sobre esse assunto aqui mais tarde quando nós ficarmos mais sofisticados no pensamento estatístico e aí a gente vai tentar visualizar o que tudo isso daqui significa mais isso apenas mais lá para a frente em tópicos mais avançados de estatística mas agora nós já podemos fazer inferências sobre as diferenças de médias se nós temos duas amostras e nós calculamos as médias de ambas as amostras e aí depois calculamos a diferença entre essas médias nós podemos tirar algumas conclusões sobre o comparecido assocon próximas essas médias estão apenas ao acaso e nós vamos fazer isso no próximo vídeo até lá