If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como estimar um valor-p a partir de uma simulação

Exemplo de estimativa de um valor-p baseado em uma simulação para aproximar uma distribuição amostral, assumindo que a hipótese nula é verdadeira.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Nós temos aqui uma questão a respeito de valores "p". Eva leu em um artigo que 6% dos adolescentes são vegetarianos, mas ela acha que em sua grande escola este número é maior. Para testar a sua teoria, Eva tomou uma amostra aleatória de 25 alunos da escola e 20% deles eram vegetarianos. Para saber a probabilidade de uma amostra como esta acontecer por acaso, Eva fez uma simulação. Ela simulou 40 amostras de n = 25 alunos de uma grande população onde 6% dos alunos eram vegetarianos. Ela anotou a proporção de vegetarianos em cada amostra. E aqui estão as proporções amostrais de suas 40 amostras. Observe que podemos escrever p = 6%, sendo "p" a proporção real para toda a população. E a hipótese nula dela é que a proporção de adolescentes vegetarianos na sua escola também seja de 6%. Ou seja, a hipótese nula não oferece novidades, é como se aquilo que está estabelecido continuasse. Mas ela pensa que este valor é maior para os estudantes da sua escola. Então, a hipótese alternativa diz que a proporção real para a população da sua escola é maior que 6%. Então, para ver se a hipótese nula será rejeitada ou não, foi tomada uma amostra. Neste caso, foi uma amostra de 25 alunos e foi calculada a proporção daqueles que são vegetarianos. Qual é a probabilidade de tomar uma amostra e ter como resultado uma porcentagem igual ou maior que 20%? Se esta probabilidade for menor que o seu limite definido pelo nível de significância, então, a hipótese nula é rejeitada. E esta probabilidade é chamada de valor "p" e ele é calculado pela probabilidade do parâmetro amostral p^ ser maior que ou igual a 20%. Neste caso, assumindo que a hipótese nula seja verdadeira. Então, se você assumir que a proporção verdadeira da população da escola é 6% de vegetarianos, se você toma uma amostra de 25 alunos, você tem 20% de vegetarianos. Qual é a probabilidade de ter 20% ou mais de vegetarianos em uma amostra de 25 alunos? Há várias maneiras de achar um resultado aproximado para isto, mas, neste caso, a Eva usou uma simulação. Retomando, a Eva fez uma simulação com 40 amostras de tamanho 25 em uma população onde 6% dos alunos são vegetarianos. E ela anotou a proporção de vegetarianos em cada uma das amostras. Então, o que ela está fazendo aqui com a simulação é uma aproximação da distribuição amostral das proporções amostrais, assumindo que a hipótese nula seja verdadeira. Temos aqui, então, que a Eva quer testar a hipótese nula, que é aqui a verdadeira proporção de vegetarianos para toda a população é 6%, contra a hipótese alternativa de que este número é maior do que 6% de alunos que são vegetarianos na sua escola. E a pergunta é, baseado nestes resultados simulados, qual é o valor "p" aproximado para o teste? Observe que a proporção amostral foi de 20%, já tinha sido dado no enunciado lá em cima. Bem, assumindo que aqui no gráfico temos uma boa aproximação para a distribuição amostral das proporções amostrais, há 40 pontos de dados aqui. Em quantos deles nós temos uma proporção amostral maior que ou igual a 20%? Aqui nós temos 20%. Então, há 3 pontos indicando amostras com proporção 20% ou maior. 3 de 40. Assumindo que o gráfico indique uma aproximação razoável, podemos dizer que o valor "p" vai ser aproximadamente 3/40 se a proporção real para a população for de 6%. Então, aproximadamente, 3 de cada 40 vezes em que se tomar amostras de tamanho 25, haverá 20% ou mais de vegetarianos nelas. Transformando 3/40 em porcentagem, ou seja, neste caso, é fácil fazer o 40 vezes 2,5 para chegar em 100. Nós vamos ter, no numerador, 3 vezes 2,5 que dá 7,5. Ou seja, o valor "p" aqui é de 7,5% ou 0,075. O que nos leva à alternativa "D". Até o próximo vídeo!