If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Introdução às distribuições de amostragem

Introdução às distribuições de amostragem.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2G - O que vamos fazer neste vídeo é trabalhar com a ideia de distribuição amostral. Para deixar as coisas um pouco mais concretas, vamos imaginar uma população de algum tipo. Digamos que temos uma urna com várias bolas, cada uma com um número escrito nela. Para essa população, nós podemos calcular parâmetros e esses parâmetros podem ser vistos como verdadeiros sobre a população. Tratamos disso em outros vídeos. Por exemplo, você poderia ter a média populacional, que seria a média dos números de todas as bolas. Você pode também obter o desvio padrão populacional. Você pode também calcular a proporção das bolas que são de números ímpares, por exemplo. Qualquer coisa do tipo. Todos esses são parâmetros populacionais. Mas já vimos em outros vídeos que você pode não conhecer o valor do parâmetro populacional, ou talvez não seja fácil de obter esse parâmetro populacional. Então, uma maneira de tentar estimar o parâmetro populacional é tomando uma amostra. Por exemplo, aqui temos uma amostra de tamanho "n" e nós poderemos calcular uma estatística, o valor de um parâmetro, para esta amostra. Então, com base nesta amostra (esta amostra é composta por "n" elementos retirados da população), nós podemos obter dados estatísticos que permitam estimar um parâmetro populacional. E nós sabemos que, aqui, estamos tratando de amostras aleatórias. E nós sabemos que o dado estatístico calculado para a amostra não necessariamente vai ter o mesmo valor do que esse dado calculado para a população. Ou seja, se tomarmos uma outra amostra, com o mesmo tamanho "n", e calcularmos o mesmo dado estatístico outra vez, nós poderemos encontrar um valor diferente do que havíamos encontrado com a primeira amostra. Então, todos esses valores obtidos são estimadores para o parâmetro populacional. E a pergunta interessante agora é: qual é a distribuição destes valores que eu posso obter para várias amostras? E a distribuição desses dados é o que nós chamamos de "distribuição amostral". Vamos fazer isso ficar um pouquinho mais concreto. Vou fazer aqui um exemplo muito simples. Vamos supor que eu tenha uma população e essa população é composta de três bolas: uma com o número 1, outra com o 2 e outra com o 3. Vamos dizer que o parâmetro populacional estudado aqui é a média. E essa média é 1 + 2 + 3, dividido por 3, que resulta 2. Mas digamos agora aqui nós vamos tomar amostras dessa população. Digamos que amostras de tamanho 2, duas bolas. Cada vez que eu tomar uma bola para ver o seu número, eu devolvo a bola para a urna. Ou seja, cada retirada de bola é um evento independente dos demais. Agora nós vamos usar as amostras de duas bolas para estimar a média populacional. Então, uma primeira amostra de tamanho 2. Digamos que nessa primeira amostra eu tenho a bola com o número 1 e a bola com o número 2. Eu posso calcular o dado estatístico da amostra aqui, que é a média. 1 + 2, dividido por 2. Isso dá 1,5. Então, eu posso fazer isso de novo e digamos que agora as duas bolas que saíram são a de número 1 e a de número 3. Calculando a média: 1 + 3, dividido por 2, dá 2. Eu poderia ficar retirando outras amostras de duas bolas e anotando a frequência com que as médias amostrais vão aparecendo. Vamos ver aqui: nesta coluna, eu vou colocar os números das bolas que foram retiradas. Lembrando que, cada vez que eu retiro uma, em seguida eu devolvo para a urna e assim eu torno os eventos independentes. Então, eu posso pegar o número 1 e depois o número 1 de novo. Ou então o número 1 e depois o número 2. E então o número 1 e em seguida o número 3. Pode ser que eu pegue o número 2 e depois o 1, o 2 e o 2, o 2 e o 3, ou então o 3 e depois o 1, 3 e 2, ou 3 e 3. Estas são todas as possibilidades que eu tenho de amostras nesta população, amostras de tamanho 2. Agora vamos calcular a média amostral em cada uma destas amostras. Então, nesta primeira linha a média é 1. Na segunda, a média é 1,5. Na próxima, a média é 2. Na próxima, temos 1,5. Na outra, a média vai ser 2. Depois, 2,5. Depois, 2 novamente. Depois, 2,5. E, finalmente, 3. Eu posso agora representar graficamente os dados que nós obtivemos para as amostras. E isso será a distribuição amostral. Neste eixo, eu vou anotar as possíveis médias amostrais. Aqui temos 1, 1,5, 2, 2,5 e 3. Neste outro eixo, eu vou colocar a frequência dessas médias. Então, vamos lá: quantos 1 de média amostral eu tenho? Apenas um. Eu poderia escrever aqui a frequência absoluta, que é um, a quantidade 1, ou então a frequência relativa, que é 1/9, porque é uma de 9 possibilidades. Aqui, então, 1/9 e o ponto representando. Agora vamos para o 1,5 na média amostral. Ele aparece em duas vezes das 9 possíveis. Então, eu tenho 2/9 aqui no gráfico. Agora vamos para o número 2. Quantas vezes ele aparece? Ele aparece ele aparece três vezes das 9 possíveis. Então, 3/9. Mostrando aqui no gráfico, o 2 tem frequência relativa 3/9 (claro que isso é 1/3). Vamos agora ver o 2,5. Ele aparece uma, duas vezes. Então, a frequência relativa dele é 2/9. Duas de 9 possibilidades. O que isso significa? Significa que, se você tomar uma amostra aleatória, com reposição, de duas bolas em uma urna de 3 bolas numeradas de 1 a 3, a probabilidade da média amostral ser 2,5 é de 2/9, ou 2 para 9. Finalmente, a média 3 aparece apenas uma vez. Então, a frequência relativa dela é de 1/9. Então, isto que você está vendo aqui é a distribuição amostral das médias amostrais para "n" igual a 2, ou seja, para o tamanho da amostra 2. Até o próximo vídeo!