Conteúdo principal
Curso: Estatística Avançada > Unidade 14
Lição 1: Prepare-se para o exame- Exemplo de teste de significância para uma proporção em uma questão de resposta aberta
- Resposta aberta do teste de significância para uma proporção (parte 2 com correção)
- Exemplo de resposta: teste de significância para uma média
- Como escolher um procedimento de inferência adequado
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo de teste de significância para uma proporção em uma questão de resposta aberta
Resolução de cada etapa de um teste de significância em uma proporção.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA10C E aí, pessoal!
Tudo bem? Nesta aula, vamos ver um exemplo
a respeito de teste de significância para uma proporção em uma
questão de resposta aberta. Para isso, temos o seguinte:
algumas caixas de uma certa marca de cereal
inclui um voucher para um aluguel de vídeo
grátis dentro da caixa. A empresa que fabrica os cereais
informa que o voucher pode ser encontrado
em 20% das caixas. No entanto, com base em suas
experiências comendo o cereal em casa, um grupo de alunos
acredita que a proporção de caixas com vouchers
é inferior a 20%. O grupo de alunos comprou 65 caixas
do cereal para investigar e, caso necessário,
fazer uma reclamação da empresa. Os alunos encontraram um total
de 11 vouchers nas 65 caixas. Suponha que é razoável assumir
que as 65 caixas compradas pelos alunos são de uma amostra aleatória do total
de caixas fabricadas do cereal. Com base nessa amostra,
os alunos estão corretos em afirmar que as caixas com vouchers
são inferiores a 20%? Justifique sua resposta
com evidências estatísticas. Sugiro que você pause o vídeo
e tente resolver sozinho. A primeira coisa que vou fazer aqui
é escrever alguns dados, porque é algo que inicialmente você faria
se estivesse resolvendo uma prova. E o que você deve pensar é:
qual é a minha hipótese nula? E a alternativa? A hipótese nula é a hipótese
que podemos anular ou não e, neste caso, é a proporção de vouchers
dentro das caixas ser igual a 20%. Já a nossa hipótese alternativa
é a hipótese da qual desconfiamos que, neste caso, é que essa
proporção é inferior a 20%. Agora, o que você deve fazer é comparar o seu nível de
significância preestabelecido com o seu valor P. Então, vamos assumir
que o nível de significância seja α = 0,05. Agora, devemos pensar
a respeito da amostra. Ou seja, se assumirmos
que a hipótese nula é verdadeira, qual é a probabilidade de obtermos
a proporção da amostra? Será que isto estará abaixo
desse nível de significância? E, se este valor estiver abaixo
do nível de significância, então, rejeitamos a hipótese nula
e consideramos a hipótese alternativa. Então, a nossa amostra é n = 65, já que os alunos compraram
um total de 65 caixas. A partir disso, podemos calcular
a proporção da amostra, que é 11 em 65, ou seja, os estudantes encontraram
11 vouchers em 65 caixas compradas. Se você resolver isso,
vai ser aproximadamente 0,169. Claro, na maioria das
provas de estatística você pode utilizar uma calculadora. Então, contas desse tipo, você pode
realizar com bastante facilidade. Uma outra coisa em que devemos prestar
atenção antes de inferirmos algo é: será que estamos atendendo
as condições para inferência? Isso é pensar se temos uma amostragem
adequada da população. Ou seja, nossa amostragem
é quase normal. A primeira condição é que
a amostra deve ser aleatória. Ou seja, condição: aleatória. Sim, se você perceber, o exercício
manda assumirmos que as 65 caixas compradas
pelos alunos são de uma amostra aleatória. Então, por causa disso, a condição
de aleatoriedade é atendida. E a próxima condição que deve ser atendida
é a condição "normal". Quase normal. Para isso, o número da amostra
multiplicado pela proporção, assumindo que essa hipótese
nula é verdadeira, deve ser maior ou igual a 10. E n, que multiplica 1 menos
a proporção da hipótese nula, tem que ser maior ou igual a 10 também. Veja bem, n vezes a proporção assumida
vai ser a mesma coisa que 65 vezes 0,2,
o que é igual a 13. E 13 é maior do que 10, ou seja,
esta primeira parte é atendida. Se substituirmos n e P₀ aqui,
vamos ficar com 65 vezes 1 menos 0,2,
que dá 0,8... Então, 65 vezes 0,8
é igual a 52. 52 é maior ou igual a 10,
isto aqui também é atendido. Portanto, a condição "normal"
também é atendida. A última condição
é a condição de independência. Não estamos testando as caixas
com reposição, não é? Por isso, temos que ter certeza
que essa amostra representa menos que 10% da população de caixas. Isso não fica bem explícito aqui.
Então, vamos assumir que tem mais de 650
caixas na população. Isso implica que n é menor
ou igual a 10% da população. E isso nos permite verificar
essa condição de independência. Agora que as condições
de inferência foram atendidas, vamos pensar sobre
a distribuição da amostragem. A distribuição de amostragem
da proporção da amostra, porque é isso que vamos utilizar
para calcular o valor P. Sabemos algumas coisas importantes
a respeito da proporção. Sabemos que a média dessa proporção
é igual à proporção da hipótese nula, e o desvio-padrão dessa proporção
é igual à raiz quadrada da proporção da hipótese nula, que multiplica 1 menos a proporção
da hipótese nula, dividido por n. Isso vai ser igual à raiz quadrada
de 0,2 vezes 0,8, dividido por 65. Se usarmos a calculadora,
isso vai ser aproximadamente 0,0496. Agora, devemos calcular o valor P, que podemos calcular com
o nosso nível de significância. A partir disso, decidimos
se devemos rejeitar ou não a hipótese nula e sugerir
a hipótese alternativa. Para descobrir o valor P, devemos
calcular a nossa estatística Z, que é quantos desvios-padrão
estamos acima ou abaixo da média da distribuição amostral. Já vimos que para
calcular essa estatística pegamos a proporção da amostra e subtraímos pela proporção assumida,
que é a proporção da hipótese nula, e dividimos isso pelo desvio-padrão
da distribuição amostral. Isso vai nos dizer quantos desvios-padrão
estamos acima ou abaixo da média da distribuição amostral. Isso vai ser igual a
0,169 menos 0,2, dividido por esse desvio-padrão,
que é 0,0496. Se você utilizar a calculadora
e realizar esse cálculo, vai encontrar o valor
de Z aproximado de -0,625. Agora você pode calcular
o seu valor P, que é a probabilidade de se obter
uma proporção da amostra que é pelo menos tão baixa
quanto a que obtivemos. Ou seja, a probabilidade da proporção
da amostra tem que ser menor ou igual a 0,169, assumindo que a hipótese
nula é verdadeira. Isso é a mesma coisa que
a probabilidade de a estatística Z ser menor ou igual a -0,625. Podemos utilizar uma calculadora
para resolver isso. Devemos vir aqui
e procurar "distribuição"... Ou seja, aqui no número 2,
que é uma distribuição acumulativa, o nosso limite inferior, podemos dizer
que é infinito negativo. Já o nosso limite superior
é -0,625. Aí, pulamos estas informações,
clicamos em "Enter", e esta vai ser a probabilidade
que estamos procurando. Então, aproximadamente 0,266. Podemos tirar uma prova real para
ver se realmente fizemos certo. Se tivermos uma distribuição
das proporções da amostra aqui, em que estamos assumindo
que a hipótese nula é verdadeira, a média da amostra vai ser igual
à nossa proporção assumida. O que significa esse resultado? Bem, se tivermos a nossa proporção
da amostra bem aqui, qual é a probabilidade de obtermos um resultado menor do que essa proporção? É isso que calculamos aqui. Veja este resultado:
a probabilidade é de quase 27%. E podemos comparar o nosso valor P
ao nível de significância preestabelecido. Obviamente, esse valor P é maior
do que o nível de significância, ou seja, 0,266 é maior do que 0,05. Como esse valor P é maior
do que o nível de significância, vamos falhar se rejeitarmos
a hipótese nula. Então, por causa disso, o grupo de estudantes vai falhar
em rejeitar a hipótese nula. Isso porque não há
evidências suficientes para sugerir
a hipótese alternativa. Eles não podem afirmar
que a probabilidade de se obter um voucher no total de caixas
é menor do que 20%. Espero que esta aula tenha te ajudado.
Até a próxima, pessoal!