If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Exemplo construindo e interpretando um intervalo de confiança para p

Verifique as condições, calcule e interprete um intervalo de confiança para estimar uma proporção populacional.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2G - Adélia tem mais de 500 músicas no seu telefone celular e quer estimar qual porcentagem das músicas são de artistas mulheres. Ela toma uma amostra aleatória simples de 50 músicas de seu telefone e verifica que 20 delas são de artistas mulheres. Com base na amostra, qual dos seguintes é o intervalo de confiança de 99% para a porcentagem de músicas de artistas mulheres no telefone de Adélia? Sugiro que você pause o vídeo e tente achar a resposta sozinho primeiro. Vamos lá, Adélia tem aqui uma população de suas músicas e quer descobrir que porcentagem delas são músicas de artistas femininas. Ela poderia analisar todas as suas músicas e ver o valor "p" da porcentagem de músicas de artistas mulheres. Entretanto, ela tomou uma amostra dessa população, essa amostra com tamanho n = 50, ou seja, uma amostra de 50 músicas. A partir daí, ela calculou a porcentagem de artistas mulheres na amostra, um parâmetro amostral ou uma proporção amostral, que nós vamos indicar por p^, e que é igual a 20 de 50, 20 dividido por 50. Isso dá resultado 0,4, ou seja, 40% das músicas da amostra são de artistas mulheres. Queremos agora construir o intervalo de confiança de 99% e para isso precisamos primeiro verificar se estamos agindo corretamente, usando uma técnica adequada. Antes de calcular o intervalo de confiança, vamos ter certeza de que a nossa distribuição amostral não está sendo distorcida, ou não está distorcendo os dados de alguma forma. A primeira coisa que precisamos garantir é que a amostra seja realmente aleatória. Na descrição da situação, verificamos que Adélia fez uma amostra aleatória das músicas. Então, vamos considerar que este primeiro quesito está atendido. O segundo quesito é assumir, ou poder assumir que a distribuição amostral do nosso parâmetro é aproximadamente normal. E para isso nós precisamos garantir que, na nossa amostra, nós tenhamos pelo menos 10 sucessos e 10 insucessos para aquilo que estamos pesquisando. E aqui, de fato, das 50 músicas, 20 são consideradas sucesso, ou seja, são de artistas femininas, e 30 são não-sucesso, ou seja, são de artistas não femininas. De maneira que atendemos a este quesito também. A próxima condição é de que a nossa amostra seja independente. É a regra da independência, ou a regra dos 10%. Isso significa que, para cada a música que nós tomamos para compor a amostra, se nós a tomarmos, anotarmos se é música de artista feminina e depois devolvemos para a população, para em seguida tomar outra música para compor a amostra, isso faria com que essas observações fossem, com absoluta certeza, independentes. Entretanto, pelas condições do problema, nós sabemos que ela não fez assim. Ou seja, ela tomava uma música e não devolvia para o conjunto de população para depois tomar outra para compor a amostra. Porém, nós podemos assumir a independência dessas observações da maneira como Adélia fez se o tamanho da amostra é de no máximo 10% do tamanho da população. E é o que acontece. A amostra de Adélia é de 50 músicas, que é exatamente 10% das 500 da população, de maneira que nós podemos considerar que o critério da independência está satisfeito. Satisfeitas essas três condições, podemos olhar para o intervalo de confiança, que é composto pelo valor do parâmetro amostral, mais ou menos um valor crítico (esse valor crítico depende do nível de confiança que nós queremos ter, que aqui é de 99%), multiplicado pelo desvio-padrão da distribuição amostral do parâmetro estudado. Mas, como nós não temos o desvio-padrão amostral, nós podemos usar o erro-padrão. Ele é calculado pela raiz quadrada de p^ vezes (1 - p^), tudo isso sobre "n", que é o tamanho da amostra (50, neste caso). Temos aqui, então, que o p^ é 0,4, ou seriam os 40%, mais ou menos o z*, que é o valor crítico, multiplicado pela raiz quadrada do p^, que é 0,4, vezes (1 - p^), que vai dar 0,6, tudo isso sobre 50. Com isso, as alternativas C e D podem nos dar o resultado correto. Na alternativa C, estamos dizendo que, no nosso intervalo de confiança, vamos 1,96 erros-padrões para mais ou para menos do nosso parâmetro amostral. E, na alternativa D, estamos dizendo que nós iriamos 2,576 erros-padrão para mais ou para menos do parâmetro amostral. Para decidir essa informação, temos de olhar para o intervalo de confiança de 99%. Vamos interpretar isso na distribuição normal. Aqui na curva normal, vou marcar a área que nos dá o intervalo de confiança de 99%. Seria esta área aqui. Se esta área toda é 99%, então, as caudas aqui são de 0,5% para cada lado. Nós vamos, então, na tabela Z, procurar o valor de "z" correspondente ao 99,5%. Isso porque, na maioria das tabelas Z, é dada a área embaixo do gráfico até inclusive o limite superior que nós estamos considerando. Ou seja, a área toda abaixo da curva à esquerda do valor considerado. Aqui está a tabela Z. O 0,995 (99,5%) estaria nesta região aqui. E, tomando o valor de "z", nós teremos aqui 2,57 ou 2,58. Então, o z* é um valor entre 2,57 e 2,58. Desta maneira, já podemos decidir que a melhor alternativa é a letra D, que tem o valor de 2,576, que está entre 2,57 e 2,58. Retomando, nós fomos capazes de construir o nosso intervalo de confiança aqui. Mas o que ele realmente significa? Significa que, se tomarmos repetidamente amostras de tamanho 50, nós podemos usar repetidamente essa técnica para construir intervalos de confiança. Então, 99% desses intervalos construídos vão conter o valor real do parâmetro para a população. Até o próximo vídeo!