Conteúdo principal
Curso: Estatística e probabilidade > Unidade 13
Lição 2: Comparação de duas médias- Significância estatística de experimento
- Significância estatística das velocidades de ônibus
- Teste de hipóteses em experimentos
- Diferença de distribuição amostral da média
- Intervalo de confiança da diferença de médias
- Esclarecimento do intervalo de confiança da diferença de médias
- Teste de hipótese para a diferença de médias
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Diferença de distribuição amostral da média
Neste vídeo, explicamos a diferença da distribuição de médias amostrais. Versão original criada por Sal Khan.
Quer participar da conversa?
- 3- A média aritmética de salário, por hora para todos os 5000 colaboradores que trabalham em uma grande empresa, é de R$ 17,50, e o desvio-padrão é de R$ 2,90. Qual seria média aritmética e o desvio padrão se fosse considerada as seguintes amostras: (2 pontos)
a) 30 colaboradores
b) Para 300 colaboradores(1 voto)- a) Média aritmética: R$ 17,50. Desvio-padrão: R$ 5,75.
b) Média aritmética: R$ 17,50. Desvio-padrão: R$ 3,55(1 voto)
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] eu quero construir um pouquinho melhor
do que eu fiz no último vídeo então digamos que eu tenha duas variáveis
aleatórias aqui então eu tenho uma das variáveis x eu vou desenhar aqui agora a
distribuição normal dessa variável aleatória não sabe se é normal mas eu
vou desenhar como se fosse uma distribuição normal
aqui está a média né a média populacional dessa minha variável
aleatória x e tem um certo tipo de desvio padrão que na verdade eu vou
escrever como se fosse aqui a variância então a variância dessa variável
aleatória x essa aqui então é a distribuição para nossa variável x e
vamos dizer também que a gente tem outra variável aleatória que a variável y e eu
vou desenhar agora que uma distribuição para essa variável y também vamos
desenhar como se fosse uma distribuição normal mesma coisa que fizemos do x e aí
fazer os mesmos parâmetros só tem uma média populacional aqui pra essa nossa
variável econômica e y o caso e tem também uma variância nessa variável
econômica y é ou não é e mais uma vez eu friso aqui que essas
distribuições elas não precisam ser normais na verdade pode ser qualquer
tipo de distribuição depois a gente vai aplicar o teorema de limite central pois
a gente vai pegar várias amostras e calcular a média e aí o teorema do
limite central vai se aplicar agora vamos pensar sobre a distribuição
mostrar dessas variáveis randômicas aqui portanto é a distribuição distribuição
amostral da média mostrar ao the xx e aí vamos dizer que o nosso tamanho mostrou
aqui nosso tamanho amostral seja igual à m
nesse caso nós vamos considerar o enem como sendo o número de amostras bem
razoável bem grande então quando a desenhar essa distribuição ela vai se
aproximar bastante de uma distribuição normal tranquilo
já vimos isso em vários outros vídeos na verdade eu vou desenhar esse gráfico um
pouco mais estreito a gente viu o teorema do limite central
que é isso que acontece na verdade o que acontece fora o dia
o padrão ele se torna menor conforme ele também mostrou que ele vai crescendo é
um é aqui então vai ter a nossa média dessa distribuição aqui e essa média
aqui eu vou colocar como notação a média do x com uma barra em cima porque a
média das médias amostrais sakineh e nós sabemos de vários vídeos anteriores que
essa média aqui ela vai ter o mesmo valor daquela média populacional
lá de cima da distribuição original nós sabemos também do limite o tema central
que a variância dessa distribuição mostrou aqui também chamada de erro
padrão da média vai ser igual a quanto hora vai ser
igual a variância da população original ali né então variância aquela variável
aleatória x / esse valor do eneac beleza só botar o eniac de uma outra cor fica
mais fácil depois de visualizar o enem vai ser essa cor aqui ó pra você
calcular o desvio-padrão basta estar aí a raiz quadrada que em ambos os lados
beleza vamos fazer agora a mesma coisa pra essa
nossa variável randômica y aqui então vamos desenhar a distribuição amostral
de yy com a barriga em cima porque são as médias amostrais aqui a distribuição
amostral das meias amostragem da variável y
agora vamos escrever essa distribuição aqui com também mostrou diferente vamos
dizer que o tamanho amostral dessa distribuição das mesmas amostragem do y
o tamanho amostral seja diferente na verdade não precisa ser diferente só vou
mostrar que serve também quando também mostrar diferente o chão está a mostrar
aqui dm então vou desenhar essa distribuição e
que também a distribuição normal também estreitinha que assim né
e aqui vai tá a média da nossa distribuição mostrar ao das mulheres a
mostrar só quebrou y beleza e essa média aqui vai ser a mesma média dessa
distribuição original da população original aqui então vai ser a média da
nossa variável y e agora a variância disso aqui
a ans também posso chamar de erro padrão da média
na verdade eu acabei falando errado tá erro padrão da média seria a raiz
quadrada isso daqui é ou não é que eu tenha variância não desvio padrão então
isso daqui é simplesmente a variância na média não é o erro padrão na média
beleza mesmo padrão tem a ver com desvio padrão e essa variante aqui ela vai ser
a mesma coisa que sakineh vai ser a variância aquela distribuição original
da população em cima né então vamos lá ver se aquela variância
ali / esse tamanho amostral m e tudo isso daqui que nós fizemos até
agora foi puramente uma revisão eu só fiz com duas variáveis diferente em uma
razão para fazer isso porque agora eu vou definir uma nova variável aleatória
e essa nova variável eu vou chamar dizer e esses e ele vai ser igual à diferença
das duas médias a mostrar as nossas outras duas variáveis
então só permanecer com a mesma cor vou colocar aqui usei é igual à x barra - o
y barra isso aqui ó essa é a definição da nossa
variável aleatória nossa nova variável aleatória z
agora o que isso significa ora eu calcular uma média mostrou aqui né
eu pego digamos um tamanho mostrar ao senhor a 10 dessa distribuição aqui e
calcula essa média e essa média amostral ela é uma variável
aleatória também porque hora imagine que você pegue 10 amostra dessa
distribuição que eu fui à média essa média de 9,2 e essa média calculada ela
vai ser uma mostra dessa outra distribuição aqui é um é a mesma coisa
acontece para isso aqui pro y digamos que nós pegamos aqui um emmy
igual a doze então 12 amostras ea gente calcula a média e essa média de 15,2
esse 15,2 essa média aqui ela pode ser vista como uma mostra dessa outra
distribuição que a distribuição mostrado as médias amostrais da variável
randômica y então o que que é o z hora
usei nada mais é que uma variável aleatória
que pode ser explicada da seguinte maneira eu vou pegar primeiro e mostras
a primeira distribuição calcular média isso vai ser x barra depois eu faço a
mesma coisa que pego m a mostra de distribuição calcula a média
e depois o cálculo a diferença entre essas duas médias
isso é o z e então você vai ser outra variável aleatória pra gente e agora tem
algumas coisinhas que a gente já sabe a respeito do z que nós deduzimos no vídeo
anterior ora a média dessa distribuição o que vou
fazer para o z-4 ser descrita como sendo a média do x barra
então essa é a média do x barra - o y barra certo e isso aqui eu posso
escrever ainda como sendo o que você lembra do vídeo anterior que isso é a
média amostral aqui da variável aleatória x - a média amostral do y
certo isso daqui a gente viu no vídeo anterior
foi uma das coisas que nós deduzimos é um é isso pode parecer um pouco abstrato
nesse momento mas no próximo vídeo a gente já começa a fazer alguns exemplos
com números aí fica mais tranqüilo fica mais fácil de você entender mas o grande
ponto do vídeo é o seguinte você perceber que você pode fazer algumas
estatísticas diferenciais a respeito de diferenças de médias o comparecido às
são duas médias amostrais aqui há uma chance aleatória ou não a uma chance
aleatória o que é um intervalo de confiança para uma diferença de médias
é isso que nós estamos construindo nesse vídeo e agora vai ser a variância dessa
distribuição sehac a variância da distribuição z que a mesma coisa que x
barra - y barra eu posso escrever como sendo a variância
dx da - o y barra e isso vai ser igual a quanto no último vídeo também nós vimos
que a variância da diferença das médias é igual à soma e não há diferença das
variâncias de cada uma delas então isso daqui vai ser igual à soma
das variâncias de cada uma dessas médias a aliança da x barra mais a variância do
y barra agora deixa eu desenhar aqui como
ficaria essa distribuição a distribuição a respeito dessa nossa nova variável
usei aqui ora essa distribuição ela também seria
uma distribuição normal a primeira que a média dela né a média
seria a média de x barra - o y barra e como a gente já viu essa média aqui é
igual à diferença dessas outras duas médias beleza acabamos de ver isso agora
deixa eu desenhar a curva que vai representar essa distribuição repare que
essa curva é mais gordinha que as outras as outras são mais estreitas aqui é mais
larga e porque eu tô fazendo isso daqui ora porque a variância aqui é igual à
soma das outras duas variantes olha aí logo esse fato vai me tornar essa curva
que um pouco mais larga que as outras duas pois é uma soma de variância né
quando eu somos variâncias obviamente estou somando também devia os padrões
logo isso aqui fica mais gordinho então aqui eu voltei a variância de x
barra - y barra agora o que que é isso aqui em termos daquela distribuição da
população original ora nós calculamos isso bem aqui em cima
tá aqui ó certo ou seja nós sabemos que isso aqui
é a mesma coisa que a variância da população original / n pelo tamanho
mostrao nós já fizemos isso muitas e muitas e muitas vezes é ou não é
então vamos reescrever isso daqui então vai ser igual a variância da nossa
distribuição populacional e você percebe que esse xis aqui ele não tem uma barra
pois ele não é a das médias a mostrar a ele apenas a variável econômica que nós
pegamos naquela população original e isso dividido pelo tamanho amostral
só não pode confundir essa variante aqui com essa variante aqui do x barra tá
essa que é a variância da distribuição mostrou das médias a moça
mas essa não é essa aqui é a variância da população à distribuição populacional
e agora isso aqui eu posso fazer então da mesma forma vou usar que o azul certo
isso aqui é a mesma coisa que isso aqui ó
é ou não é olha aí então vou escrever isso como sendo igual
a soma é que eu vou ter uma soma da variância daquele y da população
original na distribuição populacional não é esse y barra cuidado dividido
então por m que é o tamanho mostrou considerado e isso aqui então é a
variância da diferença das médias a mostrar certa
agora se você quiser saber o valor da do desvio padrão dessa distribuição aqui
isso aqui é só você calcular então a raiz quadrada é ou não é então a raiz
quadrada dessa variância vai ser o desvio-padrão desvio padrão das da
diferença das meias a mostrar isso vai ser igual a raiz quadrada disso aqui ó
ou seja da variância da distribuição populacional dividido pelo também
mostrou n mas a variância da distribuição
populacional daquela variável y dividido pelo tamanho mostrou dela que a emi ea
razão pela qual fiz isso daqui é que isso me parece bem legal olha só vez
isso daqui não parece com aquela forma da distância
na verdade eu voltar sobre esse assunto aqui mais tarde quando nós ficarmos mais
sofisticados no pensamento estatístico e aí a gente vai tentar visualizar o que
tudo isso daqui significa mais isso apenas mais lá para a frente em tópicos
mais avançados de estatística mas agora nós já podemos fazer
inferências sobre as diferenças de médias
se nós temos duas amostras e nós calculamos as médias de ambas as
amostras e aí depois calculamos a diferença entre essas médias
nós podemos tirar algumas conclusões sobre o comparecido assocon próximas
essas médias estão apenas ao acaso e nós vamos fazer isso no próximo vídeo até lá