If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Distribuição amostral da proporção amostral parte 1

Fórmulas da média e desvio-padrão de uma distribuição amostral de proporções amostrais.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2G - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vindo a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos conversar sobre a distribuição de uma amostragem da proporção da amostra. Para começar, vamos observar esta máquina de chicletes bem aqui. Nela, tem chicletes amarelos, verdes, rosas e azuis. O que queremos neste vídeo são os chicletes amarelos. Então, vamos dizer que sabemos que a proporção de chicletes amarelos aqui é "p". Isto aqui é uma população, um parâmetro de população. E, para deixar as coisas um pouquinho mais concretas, vamos apenas dizer que 60% dos chicletes são amarelos, ou 0,6 deles. Antes de resolver qualquer coisa, vamos revisar algumas coisas que vimos antes. Eu vou definir a nossa variável como uma variável aleatória de Bernoulli. Então, vamos chamar isto de "y", que é igual a 1 se, ao pegarmos um chiclete aleatoriamente da máquina, ele for amarelo. E que é igual a zero se nós pegarmos um chiclete aleatoriamente dessa máquina e ele não for amarelo. De vídeos anteriores, nós sabemos algumas coisas interessantes sobre essa variável aleatória de Bernoulli. Nós sabemos o que isso significa. Sabemos que a nossa variável aleatória de Bernoulli vai ser a proporção de chicletes amarelos nessa população. Então, vai ser igual a "p", que neste caso particular, sabemos que é 0,6. Também sabemos qual é o desvio padrão dessa variável aleatória de Bernoulli. Vai ser "p" vezes (1 - p). Na verdade, esta é a variação. Para encontrar o desvio padrão, a gente precisa encontrar a raiz quadrada disso Portanto, neste cenário específico, isso vai ser a raiz quadrada de (0,6 vezes 0,4). Ok, isso tudo é uma revisão até agora. Mas deixe-me definir outra variável aleatória "x" aqui, que é igual à soma de dez ensaios independentes de "y". Já vimos variáveis como esta antes. Esta é uma variável aleatória binomial. Agora, o que sabemos sobre sua média e o desvio padrão? Em vídeos anteriores, nós aprendemos que essa variável aleatória binomial é igual a "n" vezes a média de cada um dos julgamentos de Bernoulli. Então, nós vamos ter "n" vezes "p". Neste caso particular, vai ser... "n" é 10, afinal, estamos fazendo 10 tentativas. E "p" é 0,6. Então, isto vai ser igual a 6. E isto faz sentido. Se 60% das bolas aqui são amarelas e você fosse pegar uma amostra, ou se fosse realizar dez tentativas independentes... Ah, e um detalhe: para ser independente, é preciso repor os chicletes. Supondo que sejam tentativas independentes, você esperaria que 6 deles fossem amarelos. Nem sempre serão 6 amarelos, mas isso seria, talvez, o que você esperaria. Tudo bem, agora, qual é o desvio padrão aqui? O desvio padrão aqui é igual a... Já demonstramos isso em outros vídeos. É igual à raiz quadrada de "n" vezes "p" vezes (1 - p). Observe que você acabou de colocar um "n" bem aqui, sobre o radical. Isto, então, vai ser igual à raiz quadrada de 10 vezes 0,6 vezes 0,4. Bem, tudo isto é uma revisão. E, se tudo isto não for familiar, eu te aconselho a revisar alguns dos vídeos sobre variáveis aleatórias de Bernoulli e sobre variáveis aleatórias binomiais. Mas o que vamos fazer neste vídeo é pensar em uma distribuição de uma amostragem e que vai ser uma distribuição de amostras para uma estatística de amostra conhecida como a proporção da amostra. Parece meio complicadinho, mas no final você vai entender isso legal. Algo que nós até já conversamos quando apresentamos pela primeira vez distribuições de amostragem. E tudo isso que vimos até aqui é importante para compreender sobre o que vamos conversar. Vamos começar tirando amostras de 10. E eu não escolhi isso aleatoriamente. Eu quero fazer isso conciliando com o que fizemos com a nossa variável aleatória aqui. Então, vamos pegar uma amostra de 10 chicletes e vamos calcular a proporção que é amarela. Vamos chamar isso de nossa proporção de amostra. Queremos calcular a proporção da amostra que são amarelas. E a que isso é equivalente? Você poderia dizer: "Bem, isto é equivalente à minha variável aleatória 'x'". Eu quero contar o número de chicletes que são amarelos e aí eu vou dividir pelo tamanho da amostra. Então, eu vou dividir por "n". Neste caso, seria "x" dividido por 10. Eu sei que você deve estar pensando: "Espere! Espere um segundo! 'x' é a soma de 10 tentativas independentes. Para ser independente, você não pode pegar apenas 10 chicletes. Você tem que pegar um de cada vez e aí repor a máquina com chiclete, para que isso seja verdadeiramente independente." Mas lembre-se: temos a nossa regra dos 10%. E a regra dos 10% nos diz que, se uma amostra é menor ou igual a 10% da população, você pode tratar cada uma das tentativas (dos chicletes, neste caso) como sendo Independentes. Então, vamos apenas dizer, por uma questão de simplificação, que existem dez mil chicletes aqui. Sendo assim, podemos nos sentir muito bem considerando que as nossas amostras, que cada uma das tentativas na amostra, são independentes uma da outra pela nossa regra dos 10%. Então, cada um deles, cada um desses chicletes que vemos, vão ser independentes. Nesta situação, nós podemos fazer essa afirmação. Podemos nos sentir muito bem que essa firmação é aproximadamente verdadeira. Bem, vamos dizer que a primeira amostra que fizemos vai ter uma proporção de amostra igual a 0,3. Então, 3 de nossos 10 chicletes são amarelos. Faríamos de novo, pegaríamos outra amostra. Nós calculamos nossa proporção da amostra, usando esta estatística novamente. Lembre-se: estamos tentando estimar nosso parâmetro de população. E vamos dizer que desta vez acontece 17 em cada 10. E continuamos fazendo isso. Se a gente continuar fazendo isso e traçar em um gráfico de pontos, ou uma distribuição de pontos, e, acho que poderíamos dizer, onde teremos nossos resultados possíveis, você poderia ter zero de 10, ou 1 de 10, 2, 3, 4, 5 (que é a metade deles), 6, 7, 8, 9, 10, de forma que seriam todos eles. E então, você pode colocar isto no gráfico. Bem, 0,3: 1, 2, 3. Este é um cenário onde minha proporção de amostra é 0,3. Então, 0,7: isto é uma situação em que eu obtive um 0,7. E vamos dizer que eu fosse pegar uma outra amostra de 10 em que eu encontraria 0,7. Nós traçaríamos isto aqui. E se você continuar tomando estas amostras e continuar calculando estas proporções de amostras, a gente vai continuar traçando isto aqui. Aí, isto ficaria cada vez melhor e melhor. Ou seja, ficaria cada vez melhor a aproximação para a distribuição de amostragem da proporção de amostra Mas como podemos realmente caracterizar a verdadeira amostragem da distribuição para a proporção da amostra? Qual vai ser a média desta distribuição amostral e qual vai ser o seu desvio padrão? Bem, podemos fazer a partir disto que vimos aqui. A média da nossa distribuição amostral, da nossa proporção de amostra, vai ser igual à média da nossa variável aleatória "x", dividida por "n", que é igual a o quê? A média de "x" é "n" vezes "p". Isto é "n" vezes "p". E, ao dividir por "n", vamos ter apenas o "p". E isso faz todo o sentido, afinal, uma maneira de pensar sobre isso é que o valor esperado para a sua proporção de amostra vai ser a proporção de chiclete que você realmente vê. Então, este também é um bom indicador que isso vai ser uma estimativa razoavelmente imparcial. Agora vamos pensar sobre o desvio padrão para nossa proporção de amostra. Podemos apenas ver isto como o desvio padrão de nossa variável aleatória binomial "x", dividida por "n". Então, isto vai ser igual à raiz quadrada de "n" vezes "p" vezes (1 - p), tudo isso sobre "n". Que é a mesma coisa que... Podemos colocar este "n" dentro do radical e, ao fazer isso, teremos a raiz quadrada de "n" vezes "p" vezes (1 - p), sobre n². Dividindo o numerador e o denominador por "n", vamos ter a raiz quadrada de "p" vezes (1 - p), tudo isso sobre "n". Nesta situação particular, onde nosso parâmetro é 0,6, ou seja, nosso parâmetro de população é 0,6, teremos 0,6. E esta é a verdadeira proporção para a nossa população. Sendo assim, qual é o desvio padrão para a nossa proporção de amostra? Vai ser igual à raiz quadrada de 0,6 vezes 0,4, tudo isso sobre 10. Vamos calcular isso em uma calculadora. Vamos pegar aqui o 0,6, multiplicar com o 0,4 aí clicamos no igual, e isto dividido por 10. Clicamos no igual e aí calculamos a raiz quadrada disso. Vamos encontrar um valor aproximadamente igual a 0,15. Aproximadamente 0,15. Enfim, eu espero que você tenha compreendido tudo isso que conversamos aqui e mais uma vez eu quero deixar para você um grande abraço e até a próxima!