Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 10
Lição 2: Distribuição de amostragem de uma proporção amostral- Distribuição amostral da proporção amostral parte 1
- Distribuição amostral da proporção amostral parte 2
- Condições normais para distribuições amostrais de proporções amostrais
- A condição normal para proporções amostrais
- Média e desvio-padrão de proporções amostrais
- Exemplo de probabilidade de proporções amostrais
- Como calcular probabilidades com proporções amostrais
- Exemplo de distribuição de amostragem de uma proporção amostral
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Distribuição amostral da proporção amostral parte 1
Fórmulas da média e desvio-padrão de uma distribuição amostral de proporções amostrais.
Quer participar da conversa?
- Que vídeo mais anti-didático! Horrível!(0 votos)
Transcrição de vídeo
RKA2G - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vindo
a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos conversar sobre a distribuição
de uma amostragem da proporção da amostra. Para começar, vamos observar esta máquina
de chicletes bem aqui. Nela, tem chicletes amarelos,
verdes, rosas e azuis. O que queremos neste vídeo
são os chicletes amarelos. Então, vamos dizer que sabemos que
a proporção de chicletes amarelos aqui é "p". Isto aqui é uma população,
um parâmetro de população. E, para deixar as coisas
um pouquinho mais concretas, vamos apenas dizer que 60%
dos chicletes são amarelos, ou 0,6 deles. Antes de resolver qualquer coisa, vamos revisar
algumas coisas que vimos antes. Eu vou definir a nossa variável como
uma variável aleatória de Bernoulli. Então, vamos chamar isto de "y", que é igual a 1 se, ao pegarmos um chiclete
aleatoriamente da máquina, ele for amarelo. E que é igual a zero se nós pegarmos
um chiclete aleatoriamente dessa máquina e ele não for amarelo. De vídeos anteriores, nós sabemos
algumas coisas interessantes sobre essa variável aleatória de Bernoulli. Nós sabemos o que isso significa. Sabemos que a nossa variável
aleatória de Bernoulli vai ser a proporção de chicletes amarelos
nessa população. Então, vai ser igual a "p", que neste caso particular, sabemos que é 0,6. Também sabemos qual é o desvio padrão
dessa variável aleatória de Bernoulli. Vai ser "p" vezes (1 - p). Na verdade, esta é a variação. Para encontrar o desvio padrão, a gente
precisa encontrar a raiz quadrada disso Portanto, neste cenário específico, isso vai ser a raiz quadrada de
(0,6 vezes 0,4). Ok, isso tudo é uma revisão até agora. Mas deixe-me definir outra variável
aleatória "x" aqui, que é igual à soma de dez ensaios
independentes de "y". Já vimos variáveis como esta antes. Esta é uma variável aleatória binomial. Agora, o que sabemos sobre sua média
e o desvio padrão? Em vídeos anteriores, nós aprendemos
que essa variável aleatória binomial é igual a "n" vezes a média de cada um
dos julgamentos de Bernoulli. Então, nós vamos ter "n" vezes "p". Neste caso particular, vai ser... "n" é 10, afinal, estamos fazendo 10 tentativas. E "p" é 0,6. Então, isto vai ser igual a 6. E isto faz sentido. Se 60% das bolas aqui são amarelas e você fosse pegar uma amostra, ou se fosse
realizar dez tentativas independentes... Ah, e um detalhe: para ser independente, é preciso
repor os chicletes. Supondo que sejam tentativas
independentes, você esperaria que 6 deles fossem amarelos. Nem sempre serão 6 amarelos, mas isso seria, talvez, o que você esperaria. Tudo bem, agora, qual é o desvio
padrão aqui? O desvio padrão aqui é igual a...
Já demonstramos isso em outros vídeos. É igual à raiz quadrada de "n" vezes "p" vezes (1 - p). Observe que você acabou de colocar um
"n" bem aqui, sobre o radical. Isto, então, vai ser igual à raiz quadrada
de 10 vezes 0,6 vezes 0,4. Bem, tudo isto é uma revisão. E, se tudo isto não for familiar, eu te aconselho a revisar alguns dos vídeos
sobre variáveis aleatórias de Bernoulli e sobre variáveis aleatórias binomiais. Mas o que vamos fazer neste vídeo é pensar
em uma distribuição de uma amostragem e que vai ser uma distribuição de amostras
para uma estatística de amostra conhecida como a proporção da amostra. Parece meio complicadinho, mas no final
você vai entender isso legal. Algo que nós até já conversamos quando apresentamos pela primeira vez
distribuições de amostragem. E tudo isso que vimos até aqui é importante
para compreender sobre o que vamos conversar. Vamos começar tirando amostras de 10. E eu não escolhi isso aleatoriamente. Eu quero fazer isso conciliando com o que
fizemos com a nossa variável aleatória aqui. Então, vamos pegar uma amostra
de 10 chicletes e vamos calcular a proporção que é amarela. Vamos chamar isso de
nossa proporção de amostra. Queremos calcular a proporção da amostra
que são amarelas. E a que isso é equivalente? Você poderia dizer: "Bem, isto é equivalente
à minha variável aleatória 'x'". Eu quero contar o número de chicletes
que são amarelos e aí eu vou dividir pelo tamanho da amostra. Então, eu vou dividir por "n". Neste caso, seria "x" dividido por 10. Eu sei que você deve estar pensando:
"Espere! Espere um segundo! 'x' é a soma de 10 tentativas independentes. Para ser independente, você não pode
pegar apenas 10 chicletes. Você tem que pegar um de cada vez e aí repor a máquina com chiclete, para que isso seja verdadeiramente
independente." Mas lembre-se: temos a nossa regra dos 10%. E a regra dos 10% nos diz que, se uma amostra é menor ou igual
a 10% da população, você pode tratar cada uma das tentativas
(dos chicletes, neste caso) como sendo Independentes. Então, vamos apenas dizer, por uma
questão de simplificação, que existem dez mil chicletes aqui. Sendo assim, podemos nos sentir muito
bem considerando que as nossas amostras, que cada uma das tentativas na amostra, são independentes uma da outra pela
nossa regra dos 10%. Então, cada um deles, cada um desses
chicletes que vemos, vão ser independentes. Nesta situação, nós podemos fazer
essa afirmação. Podemos nos sentir muito bem que essa
firmação é aproximadamente verdadeira. Bem, vamos dizer que a primeira
amostra que fizemos vai ter uma proporção de amostra
igual a 0,3. Então, 3 de nossos 10 chicletes
são amarelos. Faríamos de novo, pegaríamos
outra amostra. Nós calculamos nossa proporção
da amostra, usando esta estatística novamente. Lembre-se: estamos tentando estimar
nosso parâmetro de população. E vamos dizer que desta vez acontece
17 em cada 10. E continuamos fazendo isso. Se a gente continuar fazendo isso e traçar
em um gráfico de pontos, ou uma distribuição de pontos, e, acho que poderíamos dizer, onde
teremos nossos resultados possíveis, você poderia ter zero de 10, ou 1 de 10, 2, 3, 4, 5 (que é a metade deles), 6, 7, 8, 9, 10, de forma que seriam todos eles. E então, você pode colocar isto no gráfico. Bem, 0,3: 1, 2, 3. Este é um cenário onde minha
proporção de amostra é 0,3. Então, 0,7: isto é uma situação
em que eu obtive um 0,7. E vamos dizer que eu fosse pegar uma outra
amostra de 10 em que eu encontraria 0,7. Nós traçaríamos isto aqui. E se você continuar tomando
estas amostras e continuar calculando estas
proporções de amostras, a gente vai continuar traçando isto aqui. Aí, isto ficaria cada vez melhor e melhor. Ou seja, ficaria cada vez melhor
a aproximação para a distribuição de amostragem
da proporção de amostra Mas como podemos realmente
caracterizar a verdadeira amostragem da distribuição para a proporção da amostra? Qual vai ser a média desta distribuição amostral e qual vai ser o seu desvio padrão? Bem, podemos fazer a partir disto
que vimos aqui. A média da nossa distribuição amostral,
da nossa proporção de amostra, vai ser igual à média da nossa variável
aleatória "x", dividida por "n", que é igual a o quê? A média de "x" é "n" vezes "p". Isto é "n" vezes "p". E, ao dividir por "n", vamos ter apenas o "p". E isso faz todo o sentido, afinal, uma maneira de pensar sobre isso é que o valor esperado para
a sua proporção de amostra vai ser a proporção de chiclete
que você realmente vê. Então, este também é um bom indicador que isso vai ser uma estimativa
razoavelmente imparcial. Agora vamos pensar sobre o desvio padrão
para nossa proporção de amostra. Podemos apenas ver isto como o desvio
padrão de nossa variável aleatória binomial "x", dividida por "n". Então, isto vai ser igual à raiz quadrada
de "n" vezes "p" vezes (1 - p), tudo isso sobre "n". Que é a mesma coisa que... Podemos colocar este "n"
dentro do radical e, ao fazer isso, teremos a raiz quadrada
de "n" vezes "p" vezes (1 - p), sobre n². Dividindo o numerador e o denominador
por "n", vamos ter a raiz quadrada de "p" vezes (1 - p), tudo isso sobre "n". Nesta situação particular,
onde nosso parâmetro é 0,6, ou seja, nosso parâmetro de população é 0,6, teremos 0,6. E esta é a verdadeira proporção
para a nossa população. Sendo assim, qual é o desvio padrão
para a nossa proporção de amostra? Vai ser igual à raiz quadrada de 0,6 vezes 0,4, tudo isso sobre 10. Vamos calcular isso em uma calculadora. Vamos pegar aqui o 0,6, multiplicar com o 0,4 aí clicamos no igual, e isto dividido por 10. Clicamos no igual e aí calculamos
a raiz quadrada disso. Vamos encontrar um valor
aproximadamente igual a 0,15. Aproximadamente 0,15. Enfim, eu espero que você tenha compreendido
tudo isso que conversamos aqui e mais uma vez eu quero deixar para você
um grande abraço e até a próxima!