Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 10
Lição 1: O que é uma distribuição de amostragem?Introdução às distribuições de amostragem
Introdução às distribuições de amostragem.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA2G - O que vamos fazer neste vídeo é trabalhar com a ideia
de distribuição amostral. Para deixar as coisas um pouco mais concretas,
vamos imaginar uma população de algum tipo. Digamos que temos uma urna com várias bolas,
cada uma com um número escrito nela. Para essa população,
nós podemos calcular parâmetros e esses parâmetros podem ser vistos
como verdadeiros sobre a população. Tratamos disso em outros vídeos. Por exemplo, você poderia ter
a média populacional, que seria a média dos números
de todas as bolas. Você pode também obter
o desvio padrão populacional. Você pode também calcular a proporção das bolas
que são de números ímpares, por exemplo. Qualquer coisa do tipo. Todos esses são parâmetros populacionais. Mas já vimos em outros vídeos que você pode não conhecer
o valor do parâmetro populacional, ou talvez não seja fácil de obter
esse parâmetro populacional. Então, uma maneira de tentar estimar
o parâmetro populacional é tomando uma amostra. Por exemplo, aqui temos uma amostra
de tamanho "n" e nós poderemos calcular uma estatística,
o valor de um parâmetro, para esta amostra. Então, com base nesta amostra (esta amostra é composta por "n"
elementos retirados da população), nós podemos obter dados estatísticos que permitam estimar
um parâmetro populacional. E nós sabemos que, aqui,
estamos tratando de amostras aleatórias. E nós sabemos que o dado estatístico
calculado para a amostra não necessariamente vai ter o mesmo valor
do que esse dado calculado para a população. Ou seja, se tomarmos uma outra amostra,
com o mesmo tamanho "n", e calcularmos o mesmo dado estatístico
outra vez, nós poderemos encontrar um valor diferente do que havíamos encontrado
com a primeira amostra. Então, todos esses valores obtidos são estimadores para o parâmetro populacional. E a pergunta interessante agora é: qual é a distribuição destes valores que eu posso obter para várias amostras? E a distribuição desses dados é o que nós
chamamos de "distribuição amostral". Vamos fazer isso ficar um pouquinho
mais concreto. Vou fazer aqui um exemplo muito simples. Vamos supor que eu tenha uma população e essa população é composta de três bolas: uma com o número 1, outra com o 2
e outra com o 3. Vamos dizer que o parâmetro populacional
estudado aqui é a média. E essa média é 1 + 2 + 3, dividido por 3,
que resulta 2. Mas digamos agora aqui nós vamos tomar
amostras dessa população. Digamos que amostras de tamanho 2,
duas bolas. Cada vez que eu tomar uma bola para ver
o seu número, eu devolvo a bola para a urna. Ou seja, cada retirada de bola é um evento
independente dos demais. Agora nós vamos usar as amostras
de duas bolas para estimar a média populacional. Então, uma primeira amostra de tamanho 2. Digamos que nessa primeira amostra eu tenho
a bola com o número 1 e a bola com o número 2. Eu posso calcular o dado estatístico
da amostra aqui, que é a média. 1 + 2, dividido por 2. Isso dá 1,5. Então, eu posso fazer isso de novo e digamos
que agora as duas bolas que saíram são a de número 1 e a de número 3. Calculando a média: 1 + 3, dividido por 2, dá 2. Eu poderia ficar retirando outras
amostras de duas bolas e anotando a frequência com que
as médias amostrais vão aparecendo. Vamos ver aqui: nesta coluna, eu vou colocar os números das bolas
que foram retiradas. Lembrando que, cada vez que eu retiro uma,
em seguida eu devolvo para a urna e assim eu torno os eventos independentes. Então, eu posso pegar o número 1 e depois
o número 1 de novo. Ou então o número 1 e depois o número 2. E então o número 1 e em seguida o número 3. Pode ser que eu pegue o número 2 e depois o 1, o 2 e o 2, o 2 e o 3, ou então o 3 e depois o 1, 3 e 2, ou 3 e 3. Estas são todas as possibilidades que
eu tenho de amostras nesta população, amostras de tamanho 2. Agora vamos calcular a média amostral
em cada uma destas amostras. Então, nesta primeira linha a média é 1. Na segunda, a média é 1,5. Na próxima, a média é 2. Na próxima, temos 1,5. Na outra, a média vai ser 2. Depois, 2,5. Depois, 2 novamente. Depois, 2,5. E, finalmente, 3. Eu posso agora representar graficamente
os dados que nós obtivemos para as amostras. E isso será a distribuição amostral. Neste eixo, eu vou anotar
as possíveis médias amostrais. Aqui temos 1, 1,5, 2, 2,5 e 3. Neste outro eixo, eu vou colocar
a frequência dessas médias. Então, vamos lá: quantos 1 de média amostral eu tenho?
Apenas um. Eu poderia escrever aqui a frequência absoluta,
que é um, a quantidade 1, ou então a frequência relativa, que é 1/9, porque é uma de 9 possibilidades. Aqui, então, 1/9 e o ponto representando. Agora vamos para o 1,5 na média amostral.
Ele aparece em duas vezes das 9 possíveis. Então, eu tenho 2/9 aqui no gráfico. Agora vamos para o número 2.
Quantas vezes ele aparece? Ele aparece ele aparece três
vezes das 9 possíveis. Então, 3/9. Mostrando aqui no gráfico, o 2 tem frequência
relativa 3/9 (claro que isso é 1/3). Vamos agora ver o 2,5. Ele aparece
uma, duas vezes. Então, a frequência relativa dele é 2/9. Duas de 9 possibilidades. O que isso significa? Significa que, se você tomar uma amostra aleatória,
com reposição, de duas bolas em uma urna
de 3 bolas numeradas de 1 a 3, a probabilidade da média amostral ser 2,5 é de 2/9, ou 2 para 9. Finalmente, a média 3 aparece apenas uma vez. Então, a frequência relativa dela é de 1/9. Então, isto que você está vendo aqui é a distribuição amostral das médias amostrais para "n" igual a 2, ou seja,
para o tamanho da amostra 2. Até o próximo vídeo!