If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Erro padrão da média

Erro Padrão da Média (também conhecido como desvio-padrão da distribuição amostral da média!). Versão original criada por Sal Khan.

Quer participar da conversa?

  • Avatar aqualine ultimate style do usuário Antonio Alonso
    Se a partir de uma população eu tenho capacidade de retirar 100 amostras, qual a forma mais eficaz de dividir as médias para obtenção de uma distribuição amostral ? 10 médias de 10 amostras? 5 médias de 20 amostras? 20 médias de 5 amostras? como essa escolha interfere na minha distribuição amostral das médias amostrais?
    (2 votos)
    Avatar Default Khan Academy avatar do usuário
  • Avatar male robot donald style do usuário opfeloaoj
    Por que o vídeo não mostra a fórmula para população finita versus a fórmula para população infinita? De acordo com a minha apostila da faculdade existe essas fórmulas:

    σx̄ = σ/²√n População Infinita;

    ou

    σx̄ = σ/²√n . √N-n/N-1 População Finita;

    Fiquei confuso pois o vídeo só mostrou a fórmula da População Infinita.
    (2 votos)
    Avatar Default Khan Academy avatar do usuário
  • Avatar blobby green style do usuário Jota Be
    3- A média aritmética de salário, por hora para todos os 5000 colaboradores que trabalham em uma grande empresa, é de R$ 17,50, e o desvio-padrão é de R$ 2,90. Qual seria média aritmética e o desvio padrão se fosse considerada as seguintes amostras: (2 pontos)
    a) 30 colaboradores
    b) Para 300 colaboradores
    (2 votos)
    Avatar Default Khan Academy avatar do usuário
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA4JL - Nós já vimos nos últimos vídeos que podemos começar aqui com uma distribuição qualquer. Pode ser uma distribuição normal, legal e tal, mas a verdade é que você pode ter qualquer tipo de distribuição, por exemplo essa daqui, uma distribuição meio maluca aqui, não é? Vamos supor que a gente tenha essa distribuição aqui, certo? E aí, o que nós fazemos? Nós pegamos aqui amostras aleatórias dessa distribuição. Então digamos, por exemplo, que essa distribuição aqui tenha um tamanho amostral de N igual a 10, ou seja, eu vou pegar dez números dessa distribuição aqui, depois eu vou calcular a média entre esses dez números, e depois que a gente calcular essa média, nós vamos plotar o valor dessa média num outro gráfico. Então digamos que nós tenhamos uma das médias plotadas aqui, nesse lugar, aí nós fazemos isso novamente, pegamos 10 amostras e aí calculamos a média e plotamos aqui novamente. Então digamos que a segunda esteja por aqui assim, beleza? E aí imagine que você faça isso, sei lá, um zilhão de vezes. Na verdade, infinitas vezes. Você irá perceber que quanto mais vezes você fizer, mais essa distribuição vai se parecer com uma distribuição normal, e nesse caso aqui, vai se aproximar da distribuição amostral das médias amostrais. Nesse caso aqui do N igual a 10, não vai ser uma distribuição normal perfeita, mas vai se aproximar bastante. Para ser uma distribuição normal perfeita, esse N aqui teria que ser infinito, tranquilo? Então digamos que nós sigamos com esse processo de calcular médias, e aí nós vamos ter aqui, sei lá, um montão de médias aqui, um pouquinho aqui, e isso vai começar a se parecer com uma distribuição normal, vai ficar algo assim, mais ou menos, tranquilo? E aí o que nós vimos nos vídeos anteriores, por exemplo, é que se nós fizermos isso novamente, mas dessa vez para o N maior, digamos N igual a 20, o que vai acontecer? Essa distribuição vai ser mais normal do que essa aqui que nós acabamos de fazer. Talvez em vídeos futuros a gente se aprofunde mais em conceitos como assimetria e a curtose. Então o que vai acontecer aqui vai ser o seguinte: vai ter também um desvio padrão menor, essa distribuição vai ser mais normal, e vai ter um desvio padrão menor. Então, as médias, nesse caso todos terão as mesmas médias amostrais, digamos que a média amostral aqui, sei lá, seja de 5, aqui também seria uma média amostral de 5, e aqui de 5 também. Então, como você pode perceber, não importa o tamanho do N, a média vai ser sempre a mesma. O que que vai diferenciar aqui vai ser o desvio padrão, que vai ser menor, certo? E aí como eu falei, N igual a 20 vai ser uma distribuição mais normal do que aquela do N igual a 10, então o gráfico se pareceria mais com isso aqui, seria mais pontudo dessa forma. E aí se nós usarmos um tamanho amostral ainda maior, digamos N igual a 100 aqui, o que vai acontecer? Nós vamos ter uma distribuição que vai se encaixar ainda melhor na distribuição normal. Ela vai se parecer mais normal ainda, vai ter um desvio padrão ainda menor que todas aquelas outras distribuições, certo? O que nós estamos fazendo aqui é pegando uma centena daquelas amostras da distribuição original, calculando essas médias e depois plotando, e aí a gente vai ter a distribuição amostral das médias amostrais para quando o tamanho amostral for de N igual a 100. É isso que está acontecendo em todas elas aqui, certo? Então se nós fizermos isso várias vezes, pegar 100 amostras, calcular a média, plotar, pegar 100 amostras calcular a média, plotar, a gente vai ter um gráfico ainda mais normal que os outros para N igual a 100. E para esse caso, então, como vai ser o desvio padrão? Ora, vai ser algo menor ainda, vai ser assim, bem mais pontudo do que os outros. Olha aí. O gráfico vai ser mais ou menos assim, vai ser mais normal que os outros exemplos. Eu vou mostrar para vocês que isso aqui realmente acontece naquele aplicativo que nós usamos nos vídeos anteriores. E como a gente está percebendo, duas coisas acontecem aqui. Conforme você aumenta o seu tamanho amostral, uma das coisas que acontece é que a distribuição vai se tornar mais normal para cada tamanho amostral maior do que anterior, a distribuição fica mais normal, e além disso o desvio padrão fica menor. Conforme você aumenta o tamanho amostral, o desvio padrão é menor. E aí você pode se perguntar assim: "Ora, mas será que existe uma fórmula para isso?" Bem, o que eu posso dizer aqui é o seguinte: se eu sei o desvio padrão dessa minha função original de densidade de probabilidades, o desvio padrão sigma... Aqui como você sabe é a média representada pela letra grega mi (μ), o desvio padrão é representado pelo sigma (σ), então se eu sei σ, o desvio padrão, e eu sei o valor do N, e esse N aqui, é claro, vai variar de acordo com o número de amostras que eu estou pegando. Logo, o que a gente tem aqui? Se eu sei o desvio padrão, letra grega σ, eu sei também a variância, que é o desvio padrão elevado ao quadrado. Sei também o valor do N, não é? Portanto se sei a variância da minha distribuição e se sei o tamanho amostral, será que existe alguma maneira de predizer qual será a média dessas distribuições? Ou melhor, será que dá para a gente determinar o valor do desvio padrão e da variância dessas outras distribuições amostrais das médias amostrais? Em outras palavras, será que a gente consegue determinar o valor de σ² dessas outras distribuições, lembrando novamente: variância é apenas o desvio-padrão elevado ao quadrado. Então se eu sei o desvio-padrão, naturalmente eu sei a variância. Basta elevar o desvio-padrão ao quadrado. Você pode rever outros vídeos para relembrar esse assunto beleza? Portanto, só para efeitos de diferenciação, esse σ² aqui, a variância, é função de densidade de probabilidade original ali e esse outro σ² aqui é a variância de quê? Da distribuição amostral das médias amostrais. Então para diferenciar vou colocar um x com tracinho em cima, que é como a gente representa as médias amostrais, tranquilo? Então, só para a gente lembrar novamente, a letra grega μ, essa letra aqui, ela significa simplesmente a média, enquanto que o x com tracinho em cima representa o quê? Representa a média amostral. Então "média amostral". Portanto, o que eu estou dizendo aqui é que essa aqui é a variância da minha média amostral. E só para a gente também ter uma notação para essas outras médias aqui, eu vou dizer o seguinte: essa média aqui é a média da distribuição que eu fiz originalmente dessa função de densidade de probabilidade, que é a média que deu 5. Essa média aqui, já não. É a média das médias amostrais, é ou não é? Portanto, é a média das médias. Olha aí. E é claro, como a gente já sabe, tanto a média original quanto essa outra média aqui das médias amostrais é a mesma, certo? Então a mesma coisa vai acontecer aqui. Aqui eu vou ter a média das minhas médias amostrais. Mas o ponto deste vídeo aqui, o que eu quero fazer com vocês é o seguinte: é determinar o valor da variância, saber se tem como determinar esse valor, apenas sabendo o valor da variância aqui na distribuição original e o valor do N. E, é claro, existe essa maneira, sim. Eu não vou fazer aqui uma demonstração formal, mas eu quero fazer apenas com que você tenha uma intuição sobre como isso funciona. Eu quero que você já tenha na sua mente, por exemplo, que quanto maior for o meu tamanho amostral, mais as minhas médias amostrais vão se concentrar num determinado ponto, vão ficar mais focadas aqui, ou seja, a variância vai ser menor, ou seja, com N igual a 100 é muito mais provável que você retire muitos valores que estão bem próximos aqui da média, daquela nossa média 5, do que valores que fogem dessa média 5. Enquanto que para N igual a 10, N igual a 20, N igual a 2, por exemplo, um N muito pequeno, esses valores divergem bastante da média, não é? Então, quanto menor for esse tamanho amostral, mais esticado vai ser esse gráfico aqui, certo? E quanto maior for esse N, mais próximo da distribuição normal isso aqui vai ser. Então de alguma maneira a gente já sabe aqui o seguinte: que a variância e o N são inversamente proporcionais. O que isso quer dizer? Que quanto maior é N, menor é a variância. Olha aí. Conseguiu concluir isso também, que quanto maior é o N, menor é o desvio-padrão, logo menor é a variância? Eu não vou fazer neste vídeo, como eu já disse, uma demonstração formal dessas coisas. Eu quero apenas dar um operacional, dar uma coisa concreta para você ter a intuição de como isso funciona, porque para mim, em estatística, é mais fácil você aprender primeiro a parte operacional da coisa, saber como funciona, ter a intuição daquilo para depois partir para os formalismos, certo? Ou seja, primeiro eu quero que você tenha uma visão geral da coisa e depois a gente se aprofunda mais na questão matemática. E aí a gente vai ter o seguinte: que a variância da distribuição das médias amostrais aqui vai ser igual à variância daquela nossa função original de densidade e probabilidade, essa nossa primeira distribuição aqui, sobre o valor do N. E é só isso. Olha aí que fácil, não é? Então a gente vai ter a variância da nossa distribuição original dividida pelo valor do N. Muito fácil, muito simples. Então, por exemplo, digamos que isso aqui tenha uma variância, σ², igual a 20. Eu apenas construí esse número da minha cabeça, eu apenas estou determinado um valor qualquer, uma variância igual a 20. E aí digamos que o nosso N seja igual a 20 também, logo, nesse caso de a variância ser 20 e do N 20, que vai ser, por exemplo, esse caso aqui, a gente vai ter o quê? Que a variância da nossa distribuição amostral das médias amostrais, para esse caso, vai ser igual a 20 dividido por 20, já que esse 20 aqui é o valor da variância da distribuição original e esse 20 é o valor desse N, do tamanho amostral. Está certo? Logo 20 dividido por 20 dá quanto? Dá 1. E agora? Com esse 1 aqui eu já consigo determinar o valor do desvio-padrão dessa distribuição aqui, sim ou não? Basta extrair o quê? A raiz quadrada, já que o desvio-padrão é a raiz quadrada da variância, não é? Logo o desvio-padrão para essa distribuição aqui vai ser igual à raiz quadrada de 1, que é igual a 1. Logo eu também posso reescrever isso aqui de uma outra maneira. Que maneira? Ora, basta extrair a raiz quadrada de ambos os lados aqui, não é? E então eu vou descobrir o quê? O desvio-padrão da minha distribuição amostral das médias amostrais. Então o desvio-padrão da distribuição amostral das médias amostrais vai ser igual à raiz quadrada da variância da distribuição original dividida pelo valor do N. Então isso daqui é o desvio-padrão da nossa distribuição amostral das médias amostrais, que também é chamado de desvio-padrão das médias, ou ainda isso é chamado de erro padrão. Vou escrever aqui para você. Erro padrão da média. Então não fique confuso, apesar de a gente repetir várias vezes a palavra "amostra", "amostral" e "média", você não pode ficar confuso, tranquilo? Isso daqui, então, que nós determinamos é o desvio-padrão da distribuição amostral das médias amostrais, ou o desvio-padrão das médias. Então cuidado, não se confunda, tá bom? Eu vou ficar repetindo isso várias e várias vezes até que essa ficha caia em você, certo? Então, ao extrairmos a raiz quadrada em ambos os lados, o desvio-padrão das médias ou o desvio-padrão da distribuição amostral das médias amostrais é igual à raiz quadrada da variância da nossa distribuição original dividida pelo N. Tamanho amostral, não é? Isso aqui é simplesmente igual a quanto? Raiz quadrada de σ² é o próprio σ, não é? É o desvio-padrão daquela nossa distribuição original que não é nem um pouco normal, não é? Tudo isso dividido pela raiz quadrada de N. Então aqui na minha cabeça eu gosto de determinar primeiro a variância porque a variância da nossa distribuição amostral das médias amostrais é o inverso, é inversamente proporcional ao valor do N, a nossa variância da distribuição original é inversamente proporcional ao valor do tamanho amostral e daqui a gente deduz essa outra fórmula do desvio-padrão da distribuição amostral das médias amostrais. Então isso daqui para mim é muito simples. Basta que eu calcule, então, a variância dividida por N e se eu quiser o desvio-padrão, apenas tiro a raiz quadrada em ambos os lados. Muito fácil. Então nós acabamos de fazer esse exemplo aqui para quando N é igual a 20 e agora como será, por exemplo, que ficaria para N igual a 100 aqui? Ora, também seria mais ou menos da mesma forma, não é? Olha só. Eu teria que a minha variância da distribuição amostral das médias amostrais, ou a variância das médias amostrais, vai ser igual à variância da distribuição original, que é 20, dividida pelo valor do tamanho amostral, que nesse caso aqui N é igual a 100. Então 20 sobre 100, certo? Então isso daqui vai ser igual a quanto? ⅕. E o desvio-padrão, agora? Basta extrair a raiz quadrada em ambos os lados, não é? Então o desvio padrão vai ser igual a 1 sobre √5, esse aqui é o desvio-padrão da distribuição amostral das médias amostrais, ou desvio-padrão das médias amostrais, ou o erro padrão na média, certo? Portanto, o que vai acontecer aqui? Ora, isso aqui vai ser um pouquinho menor que ½, que meio, esse desvio padrão, enquanto aqui o desvio-padrão é igual a 1. Repare que diminuiu o desvio-padrão, o valor do desvio-padrão. Conforme N aumentou, o desvio-padrão ficou menor. Mas aí você vai chegar para mim e falar assim: "Ora, eu não acredito em você. Você me deu essa fórmula aqui, mas não estou acreditando que ela seja verdadeira." Vamos fazer, então, aquela nossa simulação para ver se você acredita mais em mim agora. Deixe-me bagunçar um pouquinho com essa distribuição, porque pode ser qualquer distribuição. Assim está bom. Vou bagunçar aqui. Beleza. Agora vou pegar um N do qual seja fácil de extrair a raiz quadrada. N igual a 16 e N igual a 25. Pronto. Então aqui o que vai acontecer vai ser o seguinte: ele vai pegar 16 amostras aleatórias dessa distribuição, calcular a média e plotar aqui. Então aqui o que vai acontecer vai ser o seguinte: ele vai pegar, nesse primeiro caso, 16 amostras aleatórias dessa distribuição louca, vai botar essas 16 amostras aqui, calcular a média e plotar aqui embaixo. E aqui ele vai fazer a mesma coisa, só que para N igual a 25. Ele vai pegar 25 números aleatórios aqui, calcular a média e plotar o valor da média aqui. Deixe-me animar uma vez para vocês verem como é que funciona. Você percebe que primeiro ele vai pegar 16 amostras dessa distribuição aqui... Pegou 16, olha aí. Colocou aqui. Plotou. Agora ele vai pegar 25 para fazer a mesma coisa aqui no gráfico de baixo. Pega 25, calcula a média, e, olha lá, plotou. Beleza? É isso que ele está fazendo. E se eu fizesse isso agora dez mil vezes, o que aconteceria? Deixe-me clicar aqui em dez mil... Olha aí. Beleza, não é? O que está acontecendo aqui? Você está percebendo que, visualmente, quando N é maior, no caso do N igual a 25 aqui, a distribuição fica mais normal e fica mais estreita do que essa distribuição daqui de cima, é ou não é? Agora vamos calcular essas coisas, não é? Repare que o desvio-padrão dessa nossa distribuição original foi de 9,48. O desvio-padrão dessa primeira distribuição das médias amostrais aqui foi de 2,36 e esse outro desvio-padrão, 1,91. Tenho de decorar esses números agora, não é? Vamos lá voltar, então, para o nosso editor de imagem. Olha aí. Vamos calcular aqui como isso ficaria, não é? Então o nosso desvio-padrão da distribuição original era igual a quanto? 9,48, não é? Agora, para N igual a 16, quanto foi o desvio-padrão? Deixe-me dar uma colada lá novamente. 2,36, não é? Então o desvio-padrão das médias amostrais foi de 2,36. E para N igual a 25? Quando N for igual a 25, o desvio-padrão das médias amostrais foi igual a quanto? Vamos voltar lá para colar de novo. 1,91. 1,91. Agora vamos ver se isso aqui está em conformidade com aquela fórmula que eu apresentei agora há pouco. Aquela fórmula que eu apresentei era o quê? Dizia que a variância da nossa distribuição amostral das médias amostrais é igual à variância da nossa distribuição original dividida pelo valor do tamanho amostral. Eu posso extrair a raiz quadrada em ambos os lados que eu vou ter que o erro padrão da média, que é o σ das médias amostrais, é igual ao desvio-padrão da nossa distribuição original dividido pela raiz quadrada do tamanho amostral. Agora vamos ver se isso aqui vai funcionar para essas duas coisinhas aqui. Então agora que eu vou fazer aqui é o seguinte: eu vou dividir esse valor aqui, o desvio-padrão da nossa distribuição original, que é o que eu quero saber, então vai ser 9,48 dividido pela raiz quadrada de N. N é 16, então vai ser dividido por 4. Para isso eu vou usar a minha calculadora. Tá aí. Então vamos fazer essa conta. 9,48 dividido por 4. Quanto dá? 2,37. Então isso aqui posso escrever como sendo igual a 2,37. Só que isso aqui é 2,36, mas repare só como ficou muito perto após dez mil tentativas, não é? Na verdade, o que aconteceu aqui foi uma aproximação, provavelmente, que aquele aplicativo fez, por isso que deu esse errinho ínfimo aqui nessa conta, não é? Agora vamos fazer para esse caso do N igual a 25. Vamos lá. Deixe-me só separar aqui bonitinho. Vou calcular aqui do lado. Então eu vou ter aqui o seguinte: que o nosso σ das médias amostrais, o nosso erro padrão das médias amostrais, vai ser igual a 9,48 dividido pelo valor do N, que no caso agora é 25. Só que é a raiz quadrada do N, é ou não é? Raiz quadrada do N. Raiz de 25 é 5. Então 9,48 dividido por 5. Agora vamos ver se 9,48 dividido por 5 vai dar 1,91. Para isso eu vou usar novamente a minha calculadora. Vamos lá. 9,48 dividido por 5. Igual... Olha só! 1,896. Novamente deu um número muito, muito, mas muito próximo de 1,91. Deve ter dado aquele errinho ali, um erro bem ínfimo porque o programa provavelmente aproximou esse valor de 9,48, certo? Ele pegou apenas duas casas decimais. Se ele fizesse com mais casas decimais, certamente daria 1,91. Então vamos fazer aqui mais alguns experimentos e determinar outros valores aqui. Vamos dar mais dez mil aqui. Olha lá. Olha que esses valores do desvio-padrão, eles não mudaram muita coisa, não é? Mas eu posso seguir fazendo isso. Olha lá, mudou um pouquinho, e vai mudar bem pouquinho, não vai mudar muito assim. Vamos botar 100 mil agora. Olha aí. Novamente mudou quase nada, certo? Então o que eu queria que vocês percebessem aqui era o seguinte: que a variância da distribuição amostral das médias amostrais é igual à variância da nossa distribuição original dividida pelo tamanho amostral que eu estou considerando, e que não importa o quão excêntrico ou o quão diferente aquela nossa distribuição original é, isso sempre vai funcionar. Eu sei que pode ser confuso esse N aqui, tamanho amostral, pois a gente já está pegando amostras. Esse N aqui é um conjunto de amostras que acaba se tornando um... Tem um determinado tamanho, que é chamado de tamanho amostral. Então não pode se confundir, tá bom? Então o que deve, na verdade, ter ficado claro para você neste vídeo é que isso daqui, principalmente o N, que é o que causa muita confusão, sempre que se fala em tamanho amostral, se fala no N, certo? E o que é que você faz aqui? Você pega esses 16 valores, por exemplo aqui, calcula a média deles e plota em um gráfico. Aí depois faz de novo com outros 16 valores aleatórios, calcula a média, plota no gráfico e assim por diante. Então você tem que essa fórmula aqui é verdadeira, como nós acabamos de mostrar, certo? Então a gente se vê agora nos próximos vídeos. Grande abraço. Tchau, tchau!