Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 10
Lição 3: Distribuição de amostragem de uma média amostral- Inferências sobre a média da população a partir da média amostral
- Teorema central do limite
- Distribuição da amostragem da média amostral
- Distribuição da amostragem da média amostral (parte 2)
- Erro padrão da média
- Exemplo: Probabilidade de média amostral que excede um valor
- Média e desvio-padrão de médias amostrais
- Médias amostrais e o teorema central do limite
- Como calcular probabilidades com médias amostrais
- Exemplo de distribuição de amostragem de uma média amostral
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Erro padrão da média
Erro Padrão da Média (também conhecido como desvio-padrão da distribuição amostral da média!). Versão original criada por Sal Khan.
Quer participar da conversa?
- Se a partir de uma população eu tenho capacidade de retirar 100 amostras, qual a forma mais eficaz de dividir as médias para obtenção de uma distribuição amostral ? 10 médias de 10 amostras? 5 médias de 20 amostras? 20 médias de 5 amostras? como essa escolha interfere na minha distribuição amostral das médias amostrais?(2 votos)
- Por que o vídeo não mostra a fórmula para população finita versus a fórmula para população infinita? De acordo com a minha apostila da faculdade existe essas fórmulas:
σx̄ = σ/²√n População Infinita;
ou
σx̄ = σ/²√n . √N-n/N-1 População Finita;
Fiquei confuso pois o vídeo só mostrou a fórmula da População Infinita.(2 votos) - 3- A média aritmética de salário, por hora para todos os 5000 colaboradores que trabalham em uma grande empresa, é de R$ 17,50, e o desvio-padrão é de R$ 2,90. Qual seria média aritmética e o desvio padrão se fosse considerada as seguintes amostras: (2 pontos)
a) 30 colaboradores
b) Para 300 colaboradores(2 votos)- a) Média aritmética: R$ 17,50. Desvio-padrão: R$ 5,75.
b) Média aritmética: R$ 17,50. Desvio-padrão: R$ 3,55.(1 voto)
Transcrição de vídeo
RKA4JL - Nós já vimos
nos últimos vídeos que podemos começar aqui
com uma distribuição qualquer. Pode ser uma distribuição
normal, legal e tal, mas a verdade é que você pode ter qualquer
tipo de distribuição, por exemplo essa daqui, uma distribuição
meio maluca aqui, não é? Vamos supor que a gente
tenha essa distribuição aqui, certo? E aí, o que nós fazemos? Nós pegamos aqui amostras
aleatórias dessa distribuição. Então digamos, por exemplo,
que essa distribuição aqui tenha um tamanho amostral
de N igual a 10, ou seja, eu vou pegar dez números
dessa distribuição aqui, depois eu vou calcular a média
entre esses dez números, e depois que a gente
calcular essa média, nós vamos plotar o valor
dessa média num outro gráfico. Então digamos que nós tenhamos
uma das médias plotadas aqui, nesse lugar, aí nós fazemos isso novamente,
pegamos 10 amostras e aí calculamos a média
e plotamos aqui novamente. Então digamos que a segunda
esteja por aqui assim, beleza? E aí imagine que você faça isso, sei lá,
um zilhão de vezes. Na verdade,
infinitas vezes. Você irá perceber que quanto
mais vezes você fizer, mais essa distribuição vai se parecer
com uma distribuição normal, e nesse caso aqui, vai se aproximar da
distribuição amostral das médias amostrais. Nesse caso aqui
do N igual a 10, não vai ser uma distribuição normal
perfeita, mas vai se aproximar bastante. Para ser uma distribuição normal perfeita,
esse N aqui teria que ser infinito, tranquilo? Então digamos que nós sigamos
com esse processo de calcular médias, e aí nós vamos ter aqui, sei lá, um montão
de médias aqui, um pouquinho aqui, e isso vai começar a se parecer
com uma distribuição normal, vai ficar algo assim,
mais ou menos, tranquilo? E aí o que nós vimos
nos vídeos anteriores, por exemplo, é que se nós fizermos isso novamente,
mas dessa vez para o N maior, digamos N igual a 20,
o que vai acontecer? Essa distribuição vai ser mais normal
do que essa aqui que nós acabamos de fazer. Talvez em vídeos futuros a gente se aprofunde
mais em conceitos como assimetria e a curtose. Então o que vai acontecer
aqui vai ser o seguinte: vai ter também
um desvio padrão menor, essa distribuição vai ser mais normal,
e vai ter um desvio padrão menor. Então, as médias, nesse caso todos
terão as mesmas médias amostrais, digamos que a média amostral aqui,
sei lá, seja de 5, aqui também seria uma
média amostral de 5, e aqui de 5 também. Então, como você pode perceber, não importa o tamanho do N,
a média vai ser sempre a mesma. O que que vai diferenciar aqui vai ser
o desvio padrão, que vai ser menor, certo? E aí como eu falei,
N igual a 20 vai ser uma distribuição mais normal
do que aquela do N igual a 10, então o gráfico se pareceria mais
com isso aqui, seria mais pontudo dessa forma. E aí se nós usarmos um tamanho
amostral ainda maior, digamos N igual a 100 aqui,
o que vai acontecer? Nós vamos ter uma distribuição que vai
se encaixar ainda melhor na distribuição normal. Ela vai se parecer
mais normal ainda, vai ter um desvio padrão ainda menor
que todas aquelas outras distribuições, certo? O que nós estamos fazendo
aqui é pegando uma centena daquelas amostras
da distribuição original, calculando essas médias
e depois plotando, e aí a gente vai ter a distribuição
amostral das médias amostrais para quando o tamanho
amostral for de N igual a 100. É isso que está acontecendo
em todas elas aqui, certo? Então se nós fizermos isso várias vezes,
pegar 100 amostras, calcular a média, plotar, pegar 100 amostras
calcular a média, plotar, a gente vai ter um gráfico ainda mais
normal que os outros para N igual a 100. E para esse caso, então,
como vai ser o desvio padrão? Ora, vai ser algo menor ainda, vai ser assim,
bem mais pontudo do que os outros. Olha aí. O gráfico vai ser mais ou menos assim,
vai ser mais normal que os outros exemplos. Eu vou mostrar para vocês
que isso aqui realmente acontece naquele aplicativo que nós usamos
nos vídeos anteriores. E como a gente está percebendo,
duas coisas acontecem aqui. Conforme você aumenta
o seu tamanho amostral, uma das coisas que acontece é que
a distribuição vai se tornar mais normal para cada tamanho amostral
maior do que anterior, a distribuição fica mais normal,
e além disso o desvio padrão fica menor. Conforme você aumenta o tamanho
amostral, o desvio padrão é menor. E aí você pode
se perguntar assim: "Ora, mas será que existe
uma fórmula para isso?" Bem, o que eu posso
dizer aqui é o seguinte: se eu sei o desvio padrão
dessa minha função original de densidade de probabilidades,
o desvio padrão sigma... Aqui como você sabe é a média
representada pela letra grega mi (μ), o desvio padrão é
representado pelo sigma (σ), então se eu sei σ, o desvio padrão,
e eu sei o valor do N, e esse N aqui, é claro,
vai variar de acordo com o número de amostras
que eu estou pegando. Logo, o que
a gente tem aqui? Se eu sei o desvio padrão,
letra grega σ, eu sei também a variância, que é
o desvio padrão elevado ao quadrado. Sei também o
valor do N, não é? Portanto se sei a variância da minha distribuição
e se sei o tamanho amostral, será que existe alguma maneira de predizer
qual será a média dessas distribuições? Ou melhor, será que dá para a gente determinar
o valor do desvio padrão e da variância dessas outras distribuições
amostrais das médias amostrais? Em outras palavras, será que a gente
consegue determinar o valor de σ² dessas outras distribuições,
lembrando novamente: variância é apenas o desvio-padrão
elevado ao quadrado. Então se eu sei o desvio-padrão,
naturalmente eu sei a variância. Basta elevar o
desvio-padrão ao quadrado. Você pode rever outros vídeos
para relembrar esse assunto beleza? Portanto, só para efeitos de diferenciação,
esse σ² aqui, a variância, é função de densidade
de probabilidade original ali e esse outro σ² aqui
é a variância de quê? Da distribuição amostral
das médias amostrais. Então para diferenciar vou colocar
um x com tracinho em cima, que é como a gente representa
as médias amostrais, tranquilo? Então, só para a gente
lembrar novamente, a letra grega μ,
essa letra aqui, ela significa
simplesmente a média, enquanto que o x com tracinho
em cima representa o quê? Representa a média amostral. Então "média amostral". Portanto, o que
eu estou dizendo aqui é que essa aqui é a variância
da minha média amostral. E só para a gente também ter uma notação
para essas outras médias aqui, eu vou dizer
o seguinte: essa média aqui
é a média da distribuição que eu fiz originalmente dessa função
de densidade de probabilidade, que é a média
que deu 5. Essa média aqui, já não. É a média
das médias amostrais, é ou não é? Portanto, é a média
das médias. Olha aí. E é claro, como a gente já sabe,
tanto a média original quanto essa outra média aqui
das médias amostrais é a mesma, certo? Então a mesma coisa
vai acontecer aqui. Aqui eu vou ter a média
das minhas médias amostrais. Mas o ponto deste vídeo aqui, o que
eu quero fazer com vocês é o seguinte: é determinar o valor da variância, saber
se tem como determinar esse valor, apenas sabendo o valor da variância aqui
na distribuição original e o valor do N. E, é claro, existe
essa maneira, sim. Eu não vou fazer aqui
uma demonstração formal, mas eu quero fazer apenas com que você tenha
uma intuição sobre como isso funciona. Eu quero que você já tenha
na sua mente, por exemplo, que quanto maior for
o meu tamanho amostral, mais as minhas médias amostrais
vão se concentrar num determinado ponto, vão ficar mais focadas aqui, ou seja,
a variância vai ser menor, ou seja, com N igual a 100 é muito mais
provável que você retire muitos valores que estão bem próximos
aqui da média, daquela nossa média 5, do que valores que
fogem dessa média 5. Enquanto que para
N igual a 10, N igual a 20, N igual a 2, por exemplo,
um N muito pequeno, esses valores divergem
bastante da média, não é? Então, quanto menor for esse tamanho amostral,
mais esticado vai ser esse gráfico aqui, certo? E quanto maior for esse N, mais próximo
da distribuição normal isso aqui vai ser. Então de alguma maneira
a gente já sabe aqui o seguinte: que a variância e o N são inversamente
proporcionais. O que isso quer dizer? Que quanto maior é N,
menor é a variância. Olha aí. Conseguiu concluir isso também,
que quanto maior é o N, menor é o desvio-padrão,
logo menor é a variância? Eu não vou fazer neste vídeo, como eu já disse,
uma demonstração formal dessas coisas. Eu quero apenas
dar um operacional, dar uma coisa concreta para você
ter a intuição de como isso funciona, porque para mim, em estatística,
é mais fácil você aprender primeiro a parte operacional da coisa, saber
como funciona, ter a intuição daquilo para depois partir
para os formalismos, certo? Ou seja, primeiro eu quero que você
tenha uma visão geral da coisa e depois a gente se aprofunda
mais na questão matemática. E aí a gente vai
ter o seguinte: que a variância da distribuição
das médias amostrais aqui vai ser igual à variância daquela nossa função
original de densidade e probabilidade, essa nossa primeira
distribuição aqui, sobre o valor do N.
E é só isso. Olha aí que fácil, não é? Então a gente vai ter a variância da nossa
distribuição original dividida pelo valor do N. Muito fácil,
muito simples. Então, por exemplo, digamos que isso aqui
tenha uma variância, σ², igual a 20. Eu apenas construí esse número
da minha cabeça, eu apenas estou determinado um valor
qualquer, uma variância igual a 20. E aí digamos que o nosso N
seja igual a 20 também, logo, nesse caso de a
variância ser 20 e do N 20, que vai ser, por exemplo,
esse caso aqui, a gente vai ter o quê? Que a variância da nossa distribuição amostral
das médias amostrais, para esse caso, vai ser igual a
20 dividido por 20, já que esse 20 aqui é o valor da variância
da distribuição original e esse 20 é o valor desse N,
do tamanho amostral. Está certo? Logo 20 dividido por
20 dá quanto? Dá 1. E agora? Com esse 1 aqui
eu já consigo determinar o valor do desvio-padrão
dessa distribuição aqui, sim ou não? Basta extrair o quê?
A raiz quadrada, já que o desvio-padrão
é a raiz quadrada da variância, não é? Logo o desvio-padrão
para essa distribuição aqui vai ser igual à raiz quadrada de 1,
que é igual a 1. Logo eu também posso reescrever isso aqui
de uma outra maneira. Que maneira? Ora, basta extrair a raiz quadrada
de ambos os lados aqui, não é? E então eu vou descobrir o quê?
O desvio-padrão da minha distribuição
amostral das médias amostrais. Então o desvio-padrão da distribuição
amostral das médias amostrais vai ser igual à raiz quadrada da variância da
distribuição original dividida pelo valor do N. Então isso daqui é o desvio-padrão da
nossa distribuição amostral das médias amostrais, que também é chamado
de desvio-padrão das médias, ou ainda isso é
chamado de erro padrão. Vou escrever aqui para você.
Erro padrão da média. Então não fique confuso, apesar
de a gente repetir várias vezes a palavra "amostra",
"amostral" e "média", você não pode ficar
confuso, tranquilo? Isso daqui, então, que nós
determinamos é o desvio-padrão da distribuição amostral das médias amostrais,
ou o desvio-padrão das médias. Então cuidado,
não se confunda, tá bom? Eu vou ficar repetindo isso várias e várias
vezes até que essa ficha caia em você, certo? Então, ao extrairmos a raiz
quadrada em ambos os lados, o desvio-padrão das médias ou o desvio-padrão
da distribuição amostral das médias amostrais é igual à raiz quadrada da variância
da nossa distribuição original dividida pelo N. Tamanho amostral, não é? Isso aqui é simplesmente
igual a quanto? Raiz quadrada de σ²
é o próprio σ, não é? É o desvio-padrão daquela nossa distribuição
original que não é nem um pouco normal, não é? Tudo isso dividido
pela raiz quadrada de N. Então aqui na minha cabeça eu gosto
de determinar primeiro a variância porque a variância da nossa distribuição
amostral das médias amostrais é o inverso, é inversamente proporcional ao valor do N,
a nossa variância da distribuição original é inversamente proporcional
ao valor do tamanho amostral e daqui a gente deduz essa
outra fórmula do desvio-padrão da distribuição amostral
das médias amostrais. Então isso daqui para mim
é muito simples. Basta que eu calcule,
então, a variância dividida por N e se eu quiser
o desvio-padrão, apenas tiro a raiz quadrada
em ambos os lados. Muito fácil. Então nós acabamos de fazer esse exemplo
aqui para quando N é igual a 20 e agora como será, por exemplo,
que ficaria para N igual a 100 aqui? Ora, também seria mais ou menos
da mesma forma, não é? Olha só. Eu teria que a minha variância da distribuição
amostral das médias amostrais, ou a variância
das médias amostrais, vai ser igual à variância
da distribuição original, que é 20, dividida pelo valor do tamanho amostral,
que nesse caso aqui N é igual a 100. Então 20 sobre 100, certo? Então isso daqui
vai ser igual a quanto? ⅕. E o desvio-padrão, agora? Basta extrair
a raiz quadrada em ambos os lados, não é? Então o desvio padrão
vai ser igual a 1 sobre √5, esse aqui é o desvio-padrão da distribuição
amostral das médias amostrais, ou desvio-padrão das médias amostrais,
ou o erro padrão na média, certo? Portanto, o que vai acontecer aqui? Ora, isso aqui vai ser
um pouquinho menor que ½, que meio, esse desvio padrão, enquanto aqui
o desvio-padrão é igual a 1. Repare que diminuiu o desvio-padrão,
o valor do desvio-padrão. Conforme N aumentou,
o desvio-padrão ficou menor. Mas aí você vai chegar
para mim e falar assim: "Ora, eu não acredito em você.
Você me deu essa fórmula aqui, mas não estou acreditando
que ela seja verdadeira." Vamos fazer, então, aquela nossa simulação
para ver se você acredita mais em mim agora. Deixe-me bagunçar um pouquinho
com essa distribuição, porque pode ser qualquer distribuição.
Assim está bom. Vou bagunçar aqui.
Beleza. Agora vou pegar um N do qual seja
fácil de extrair a raiz quadrada. N igual a 16 e
N igual a 25. Pronto. Então aqui o que vai acontecer
vai ser o seguinte: ele vai pegar 16 amostras
aleatórias dessa distribuição, calcular a média
e plotar aqui. Então aqui o que vai
acontecer vai ser o seguinte: ele vai pegar, nesse primeiro caso,
16 amostras aleatórias dessa distribuição louca, vai botar essas 16 amostras aqui,
calcular a média e plotar aqui embaixo. E aqui ele vai fazer a mesma coisa,
só que para N igual a 25. Ele vai pegar 25 números
aleatórios aqui, calcular a média e plotar
o valor da média aqui. Deixe-me animar uma vez para
vocês verem como é que funciona. Você percebe que primeiro ele vai pegar
16 amostras dessa distribuição aqui... Pegou 16, olha aí.
Colocou aqui. Plotou. Agora ele vai pegar 25 para fazer a mesma
coisa aqui no gráfico de baixo. Pega 25, calcula a média, e,
olha lá, plotou. Beleza? É isso que ele está fazendo. E se eu fizesse isso agora dez mil vezes,
o que aconteceria? Deixe-me clicar
aqui em dez mil... Olha aí. Beleza, não é?
O que está acontecendo aqui? Você está percebendo
que, visualmente, quando N é maior,
no caso do N igual a 25 aqui, a distribuição fica mais normal
e fica mais estreita do que essa distribuição
daqui de cima, é ou não é? Agora vamos calcular
essas coisas, não é? Repare que o desvio-padrão
dessa nossa distribuição original foi de 9,48. O desvio-padrão dessa primeira distribuição
das médias amostrais aqui foi de 2,36 e esse outro
desvio-padrão, 1,91. Tenho de decorar esses
números agora, não é? Vamos lá voltar, então, para
o nosso editor de imagem. Olha aí. Vamos calcular aqui
como isso ficaria, não é? Então o nosso desvio-padrão da distribuição
original era igual a quanto? 9,48, não é? Agora, para N igual a 16,
quanto foi o desvio-padrão? Deixe-me dar uma colada lá
novamente. 2,36, não é? Então o desvio-padrão das
médias amostrais foi de 2,36. E para N
igual a 25? Quando N for igual a 25, o desvio-padrão
das médias amostrais foi igual a quanto? Vamos voltar lá para colar
de novo. 1,91. 1,91. Agora vamos ver se isso aqui
está em conformidade com aquela fórmula que
eu apresentei agora há pouco. Aquela fórmula que
eu apresentei era o quê? Dizia que a variância da nossa distribuição
amostral das médias amostrais é igual à variância da
nossa distribuição original dividida pelo valor
do tamanho amostral. Eu posso extrair a raiz
quadrada em ambos os lados que eu vou ter que
o erro padrão da média, que é o σ
das médias amostrais, é igual ao desvio-padrão
da nossa distribuição original dividido pela raiz quadrada
do tamanho amostral. Agora vamos ver se isso aqui vai
funcionar para essas duas coisinhas aqui. Então agora que eu vou
fazer aqui é o seguinte: eu vou dividir
esse valor aqui, o desvio-padrão da nossa distribuição original,
que é o que eu quero saber, então vai ser 9,48 dividido pela
raiz quadrada de N. N é 16, então vai ser
dividido por 4. Para isso eu vou usar
a minha calculadora. Tá aí. Então vamos
fazer essa conta. 9,48 dividido por 4.
Quanto dá? 2,37. Então isso aqui posso escrever
como sendo igual a 2,37. Só que isso aqui é 2,36, mas repare só como
ficou muito perto após dez mil tentativas, não é? Na verdade, o que aconteceu aqui
foi uma aproximação, provavelmente, que aquele aplicativo fez, por isso que deu
esse errinho ínfimo aqui nessa conta, não é? Agora vamos fazer para esse caso
do N igual a 25. Vamos lá. Deixe-me só
separar aqui bonitinho. Vou calcular aqui do lado. Então eu vou ter
aqui o seguinte: que o nosso σ
das médias amostrais, o nosso erro padrão
das médias amostrais, vai ser igual a 9,48 dividido pelo valor
do N, que no caso agora é 25. Só que é a raiz quadrada
do N, é ou não é? Raiz quadrada do N.
Raiz de 25 é 5. Então 9,48 dividido por 5. Agora vamos ver se 9,48
dividido por 5 vai dar 1,91. Para isso eu vou usar novamente
a minha calculadora. Vamos lá. 9,48 dividido por 5. Igual... Olha só! 1,896. Novamente deu um número muito,
muito, mas muito próximo de 1,91. Deve ter dado aquele errinho ali,
um erro bem ínfimo porque o programa provavelmente
aproximou esse valor de 9,48, certo? Ele pegou apenas
duas casas decimais. Se ele fizesse com mais casas
decimais, certamente daria 1,91. Então vamos fazer aqui
mais alguns experimentos e determinar outros valores aqui.
Vamos dar mais dez mil aqui. Olha lá. Olha que
esses valores do desvio-padrão, eles não mudaram
muita coisa, não é? Mas eu posso seguir fazendo isso.
Olha lá, mudou um pouquinho, e vai mudar bem pouquinho,
não vai mudar muito assim. Vamos botar 100 mil agora. Olha aí.
Novamente mudou quase nada, certo? Então o que eu queria que
vocês percebessem aqui era o seguinte: que a variância da distribuição
amostral das médias amostrais é igual à variância
da nossa distribuição original dividida pelo tamanho amostral
que eu estou considerando, e que não importa o quão excêntrico ou o quão
diferente aquela nossa distribuição original é, isso sempre vai funcionar. Eu sei que pode ser confuso
esse N aqui, tamanho amostral, pois a gente já está
pegando amostras. Esse N aqui é um conjunto de amostras
que acaba se tornando um... Tem um determinado tamanho,
que é chamado de tamanho amostral. Então não pode
se confundir, tá bom? Então o que deve, na verdade,
ter ficado claro para você neste vídeo é que isso daqui, principalmente o N,
que é o que causa muita confusão, sempre que se fala em tamanho amostral,
se fala no N, certo? E o que é
que você faz aqui? Você pega esses 16 valores,
por exemplo aqui, calcula a média deles
e plota em um gráfico. Aí depois faz de novo com
outros 16 valores aleatórios, calcula a média, plota no gráfico
e assim por diante. Então você tem que
essa fórmula aqui é verdadeira, como nós acabamos
de mostrar, certo? Então a gente se vê agora
nos próximos vídeos. Grande abraço.
Tchau, tchau!