Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Referência: condições para inferência sobre uma proporção

Quando queremos fazer inferências sobre uma proporção (criar um intervalo de confiança ou fazer um teste de significância), a precisão de nossos métodos depende de algumas condições. Antes de fazer os cálculos reais do intervalo ou do teste, é importante verificar se essas condições foram ou não atendidas, caso contrário os cálculos e as conclusões obtidas não serão realmente válidas.
As condições necessárias para se fazer inferências sobre uma proporção são:
  • Aleatoriedade: os dados devem vir de uma amostra aleatória ou de um experimento randomizado.
  • Normalidade: a distribuição de amostragem de p^ precisa ser aproximadamente normal — precisa de pelo menos 10 sucessos esperados e 10 falhas esperadas.
  • Independência: as observações individuais precisam ser independentes. Se a amostragem for sem substituição, nosso tamanho de amostra não deve ser maior que 10% da população.
Vejamos cada uma dessas condições um pouco mais a fundo.

A condição de aleatoriedade

Amostras aleatórias fornecem dados não viesados de uma população. Quando amostras não são selecionadas aleatoriamente, os dados costumam ter alguma forma de viés, portanto, usar dados que não foram selecionados aleatoriamente para fazer inferências sobre sua população pode ser arriscado.
Mais especificamente, proporções amostrais são estimadores não viesados de sua proporção populacional. Por exemplo, se temos um saco de doces no qual 50% dos doces são de laranja e pegamos amostras aleatórias desse saco, algumas terão mais do que 50% de doces de laranja e algumas terão menos. Mas, em média, a proporção de doces de laranja em cada amostra será igual a 50%. Escrevemos essa propriedade como μp^=p, que permanecerá verdadeira se nossa amostra for aleatória.
No entanto, isso não necessariamente acontecerá se nossa amostra não for selecionada aleatoriamente. Amostras enviesadas levam a resultados imprecisos, portanto elas não devem ser usadas para criar intervalos de confiança ou realizar testes de significância.

A condição de normalidade

A distribuição de amostragem de p^ será aproximadamente normal se o número esperado de sucessos e falhas forem, ambos, iguais ou maiores que 10. Isso acontece quando o tamanho de nossa amostra n é razoavelmente grande. Provar isso está além do objetivo da estatística avançada, mas nosso tutorial sobre distribuições de amostragem pode fornecer alguns raciocínios e confirmações de que essa condição é de fato válida.
Então, precisamos de:
sucessos esperados: np10falhas esperadas: n(1p)10
Se estamos criando um intervalo de confiança, não temos um valor de p para inserir na condição, então, em vez disso, contamos o número de sucessos e falhas observados nos dados da amostra para termos certeza de que ambos são iguais ou maiores que 10. Se estamos fazendo um teste de significância, usamos o tamanho de nossa amostra n e o valor hipotético de p para calcular nossos números esperados de sucessos e falhas.

Condição de independência

Para usar a fórmula para o desvio-padrão de p^, as observações individuais precisam ser independentes. Quando estamos fazendo amostragens sem substituição, as observações individuais não são tecnicamente independentes, uma vez que a remoção de cada item altera a população.
Mas a condição dos 10% nos diz que, se fizermos a amostragem de 10%, ou menos, da população, poderemos tratar observações individuais como independentes, uma vez que a remoção de cada observação não alterará significativamente a população conforme a amostramos. Por exemplo, se o tamanho de nossa amostra é de n=150, deve haver pelo menos N=1.500 membros na população.
Isso nos permite usar a fórmula para o desvio-padrão de p^:
σp^=p(1p)n
Em um teste de significância, usamos o tamanho da amostra n e o valor hipotético de p.
Se estamos criando um intervalo de confiança para p, não sabemos de fato o valor de p, então substituímos p^ por uma estimativa de p. Quando fazemos isso, nós passamos a chamá-lo de erro padrão de p^ para distingui-lo do desvio-padrão.
Então, nossa fórmula para o erro padrão de p^ será
σp^p^(1p^)n

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.