Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 10
Lição 2: Intervalos de confiança para proporções- Condições para intervalos de confiança válidos para uma proporção
- Exemplos de condições para intervalos de confiança para uma proporção
- Referência: condições para inferência sobre uma proporção
- Condições para um intervalo z para uma proporção
- Valor crítico (z*) para um nível de confiança determinado
- Como calcular o valor crítico z* para um nível de confiança desejado
- Exemplo construindo e interpretando um intervalo de confiança para p
- Como calcular um intervalo z para uma proporção
- Como interpretar um intervalo z para uma proporção
- Como determinar o tamanho amostral baseado em confiança e margem de erro
- Tamanho amostral e margem de erro em um intervalo z para p
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo construindo e interpretando um intervalo de confiança para p
Verifique as condições, calcule e interprete um intervalo de confiança para estimar uma proporção populacional.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA2G - Adélia tem mais de 500 músicas
no seu telefone celular e quer estimar qual porcentagem
das músicas são de artistas mulheres. Ela toma uma amostra aleatória simples
de 50 músicas de seu telefone e verifica que 20 delas são de artistas mulheres. Com base na amostra, qual dos seguintes
é o intervalo de confiança de 99% para a porcentagem de músicas de artistas
mulheres no telefone de Adélia? Sugiro que você pause o vídeo
e tente achar a resposta sozinho primeiro. Vamos lá, Adélia tem aqui uma população
de suas músicas e quer descobrir que porcentagem delas
são músicas de artistas femininas. Ela poderia analisar todas as suas músicas e ver o valor "p" da porcentagem
de músicas de artistas mulheres. Entretanto, ela tomou uma amostra
dessa população, essa amostra com tamanho n = 50,
ou seja, uma amostra de 50 músicas. A partir daí, ela calculou a porcentagem
de artistas mulheres na amostra, um parâmetro amostral
ou uma proporção amostral, que nós vamos indicar por p^, e que é igual a 20 de 50, 20 dividido por 50. Isso dá resultado 0,4, ou seja, 40%
das músicas da amostra são de artistas mulheres. Queremos agora construir o intervalo
de confiança de 99% e para isso precisamos primeiro verificar
se estamos agindo corretamente, usando uma técnica adequada. Antes de calcular o intervalo de confiança, vamos ter certeza de que a nossa distribuição
amostral não está sendo distorcida, ou não está distorcendo
os dados de alguma forma. A primeira coisa que precisamos garantir é que a amostra seja realmente aleatória. Na descrição da situação, verificamos que
Adélia fez uma amostra aleatória das músicas. Então, vamos considerar que este
primeiro quesito está atendido. O segundo quesito é assumir,
ou poder assumir que a distribuição amostral
do nosso parâmetro é aproximadamente normal. E para isso nós precisamos garantir que,
na nossa amostra, nós tenhamos pelo menos 10 sucessos
e 10 insucessos para aquilo que estamos pesquisando. E aqui, de fato, das 50 músicas,
20 são consideradas sucesso, ou seja, são de artistas femininas, e 30 são não-sucesso, ou seja,
são de artistas não femininas. De maneira que atendemos
a este quesito também. A próxima condição é de que a nossa
amostra seja independente. É a regra da independência,
ou a regra dos 10%. Isso significa que, para cada a música que
nós tomamos para compor a amostra, se nós a tomarmos, anotarmos se é música
de artista feminina e depois devolvemos para a população, para em seguida tomar outra música
para compor a amostra, isso faria com que essas observações fossem,
com absoluta certeza, independentes. Entretanto, pelas condições do problema,
nós sabemos que ela não fez assim. Ou seja, ela tomava uma música
e não devolvia para o conjunto de população para depois tomar outra para
compor a amostra. Porém, nós podemos assumir a independência
dessas observações da maneira como Adélia fez se o tamanho da amostra é de no máximo 10%
do tamanho da população. E é o que acontece. A amostra de Adélia é de 50 músicas,
que é exatamente 10% das 500 da população, de maneira que nós podemos considerar
que o critério da independência está satisfeito. Satisfeitas essas três condições,
podemos olhar para o intervalo de confiança, que é composto pelo valor
do parâmetro amostral, mais ou menos um valor crítico (esse valor crítico depende do nível de confiança
que nós queremos ter, que aqui é de 99%), multiplicado pelo desvio-padrão da distribuição
amostral do parâmetro estudado. Mas, como nós não temos
o desvio-padrão amostral, nós podemos usar o erro-padrão. Ele é calculado pela raiz quadrada de p^
vezes (1 - p^), tudo isso sobre "n", que é o tamanho
da amostra (50, neste caso). Temos aqui, então, que o p^ é 0,4,
ou seriam os 40%, mais ou menos o z*, que é o valor crítico, multiplicado pela raiz quadrada do p^,
que é 0,4, vezes (1 - p^), que vai dar 0,6, tudo isso sobre 50. Com isso, as alternativas C e D podem
nos dar o resultado correto. Na alternativa C, estamos dizendo que, no nosso intervalo de confiança, vamos 1,96
erros-padrões para mais ou para menos do nosso parâmetro amostral. E, na alternativa D, estamos dizendo
que nós iriamos 2,576 erros-padrão para mais ou para menos
do parâmetro amostral. Para decidir essa informação, temos de olhar
para o intervalo de confiança de 99%. Vamos interpretar isso na distribuição normal. Aqui na curva normal, vou marcar a área
que nos dá o intervalo de confiança de 99%. Seria esta área aqui. Se esta área toda é 99%, então, as caudas
aqui são de 0,5% para cada lado. Nós vamos, então, na tabela Z,
procurar o valor de "z" correspondente ao 99,5%. Isso porque, na maioria das tabelas Z,
é dada a área embaixo do gráfico até inclusive o limite superior que
nós estamos considerando. Ou seja, a área toda abaixo da curva
à esquerda do valor considerado. Aqui está a tabela Z. O 0,995 (99,5%) estaria nesta região aqui. E, tomando o valor de "z", nós teremos
aqui 2,57 ou 2,58. Então, o z* é um valor entre 2,57 e 2,58. Desta maneira, já podemos decidir que
a melhor alternativa é a letra D, que tem o valor de 2,576, que está entre
2,57 e 2,58. Retomando, nós fomos capazes de construir
o nosso intervalo de confiança aqui. Mas o que ele realmente significa? Significa que, se tomarmos repetidamente
amostras de tamanho 50, nós podemos usar repetidamente essa técnica
para construir intervalos de confiança. Então, 99% desses intervalos construídos vão conter o valor real do parâmetro
para a população. Até o próximo vídeo!