Conteúdo principal
Curso: Estatística Avançada > Unidade 10
Lição 4: Como preparar um teste para a proporção de uma população- Como construir hipóteses para um teste de significância sobre uma proporção
- Como escrever hipóteses para um teste sobre uma proporção
- Condições para um teste z sobre uma proporção
- Referência: condições para inferência sobre uma proporção
- Condições para um teste z sobre uma proporção
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Referência: condições para inferência sobre uma proporção
Quando queremos fazer inferências sobre uma proporção (criar um intervalo de confiança ou fazer um teste de significância), a precisão de nossos métodos depende de algumas condições. Antes de fazer os cálculos reais do intervalo ou do teste, é importante verificar se essas condições foram ou não atendidas, caso contrário os cálculos e as conclusões obtidas não serão realmente válidas.
As condições necessárias para se fazer inferências sobre uma proporção são:
- Aleatoriedade: os dados devem vir de uma amostra aleatória ou de um experimento randomizado.
- Normalidade: a distribuição de amostragem de
precisa ser aproximadamente normal — precisa de pelo menos sucessos esperados e falhas esperadas. - Independência: as observações individuais precisam ser independentes. Se a amostragem for sem substituição, nosso tamanho de amostra não deve ser maior que
da população.
Vejamos cada uma dessas condições um pouco mais a fundo.
A condição de aleatoriedade
Amostras aleatórias fornecem dados não viesados de uma população. Quando amostras não são selecionadas aleatoriamente, os dados costumam ter alguma forma de viés, portanto, usar dados que não foram selecionados aleatoriamente para fazer inferências sobre sua população pode ser arriscado.
Mais especificamente, proporções amostrais são estimadores não viesados de sua proporção populacional. Por exemplo, se temos um saco de doces no qual dos doces são de laranja e pegamos amostras aleatórias desse saco, algumas terão mais do que de doces de laranja e algumas terão menos. Mas, em média, a proporção de doces de laranja em cada amostra será igual a . Escrevemos essa propriedade como , que permanecerá verdadeira se nossa amostra for aleatória.
No entanto, isso não necessariamente acontecerá se nossa amostra não for selecionada aleatoriamente. Amostras enviesadas levam a resultados imprecisos, portanto elas não devem ser usadas para criar intervalos de confiança ou realizar testes de significância.
A condição de normalidade
A distribuição de amostragem de será aproximadamente normal se o número esperado de sucessos e falhas forem, ambos, iguais ou maiores que . Isso acontece quando o tamanho de nossa amostra é razoavelmente grande. Provar isso está além do objetivo da estatística avançada, mas nosso tutorial sobre distribuições de amostragem pode fornecer alguns raciocínios e confirmações de que essa condição é de fato
válida.
Então, precisamos de:
Se estamos criando um intervalo de confiança, não temos um valor de para inserir na condição, então, em vez disso, contamos o número de sucessos e falhas observados nos dados da amostra para termos certeza de que ambos são iguais ou maiores que . Se estamos fazendo um teste de significância, usamos o tamanho de nossa amostra e o valor hipotético de para calcular nossos números esperados de sucessos e falhas.
Condição de independência
Para usar a fórmula para o desvio-padrão de , as observações individuais precisam ser independentes. Quando estamos fazendo amostragens sem substituição, as observações individuais não são tecnicamente independentes, uma vez que a remoção de cada item altera a população.
Mas a condição dos nos diz que, se fizermos a amostragem de , ou menos, da população, poderemos tratar observações individuais como independentes, uma vez que a remoção de cada observação não alterará significativamente a população conforme a amostramos. Por exemplo, se o tamanho de nossa amostra é de , deve haver pelo menos membros na população.
Isso nos permite usar a fórmula para o desvio-padrão de :
Em um teste de significância, usamos o tamanho da amostra e o valor hipotético de .
Se estamos criando um intervalo de confiança para , não sabemos de fato o valor de , então substituímos por uma estimativa de . Quando fazemos isso, nós passamos a chamá-lo de erro padrão de para distingui-lo do desvio-padrão.
Então, nossa fórmula para o erro padrão de será
Quer participar da conversa?
Nenhuma postagem por enquanto.