Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 9
Lição 5: Distribuições amostrais para diferenças nas proporções amostraisDiferenças de proporções amostrais — exemplos de probabilidade
Use a forma, o centro (média) e a variabilidade (desvio-padrão) para calcular as probabilidades de vários resultados quando lidamos com distribuições amostrais para as diferenças de proporções amostrais.
Introdução e revisão
Neste artigo, vamos praticar aplicar o que aprendemos sobre distribuições amostrais pelas diferenças em proporções amostrais para calcular as probabilidades de vários resultados amostrais.
Pule adiante se quiser ir direto para alguns exemplos.
Aqui está uma análise de como podemos pensar na forma, centro, e variabilidade na distribuição amostral da diferença entre duas proporções p, with, hat, on top, start subscript, 1, end subscript, minus, p, with, hat, on top, start subscript, 2, end subscript:
Forma
A forma de uma distribuição amostral de p, with, hat, on top, start subscript, 1, end subscript, minus, p, with, hat, on top, start subscript, 2, end subscript depende de se as duas amostras passam a condição da grande quantidade.
- Se esperamos pelo menos 10 sucessos e pelo menos 10 fracassos nas duas amostras, então a distribuição amostral de p, with, hat, on top, start subscript, 1, end subscript, minus, p, with, hat, on top, start subscript, 2, end subscript será aproximadamente normal.
- Se uma ou mais dessas amostras for menor que 10, então a distribuição amostral não será aproximadamente normal.
Centro
A diferença média é a diferença entre as proporções populacionais:
Dispersão
O desvio-padrão da diferença é:
(em que n, start subscript, 1, end subscript e n, start subscript, 2, end subscript são os tamanhos de cada amostra).
Esta fórmula de desvio-padrão está exatamente correta, desde que tenhamos:
- Observações independentes entre as duas amostras.
- Observações independentes dentro de cada amostra*.
*Se estivermos amostrando sem substituição, essa fórmula na verdade vai superestimar o desvio-padrão, mas ele vai ser extremamente próximo do valor correto, desde que cada amostra seja menor que 10, percent de sua população.
Vamos tentar aplicar essas ideias a alguns exemplos e ver se podemos usá-las para calcular algumas probabilidades.
Exemplo 1
Yuki é candidata a prefeita e quer saber quanto apoio tem em dois distritos diferentes. Ela não sabe, mas tem o apoio de 45, percent dos 8, point, 000 eleitores do Distrito A e de 40, percent dos 6, point, 500 eleitores do Distrito B.
Yuki contrata uma empresa de pesquisa para coletar amostras aleatórias de 100 eleitores de cada distrito. A empresa então analisa a diferença entre as proporções dos eleitores que a apoiam em cada amostra left parenthesis, p, with, hat, on top, start subscript, start text, A, end text, end subscript, minus, p, with, hat, on top, start subscript, start text, B, end text, end subscript, right parenthesis.
Exemplo 2
Uma empresa tem dois escritórios, um em São Paulo e um no Rio de Janeiro.
- Cada escritório tem cerca de 600 funcionários no total.
- 85, percent dos funcionários do escritório de São Paulo têm menos de 40 anos de idade.
- 81, percent dos funcionários do escritório do Rio de Janeiro têm menos de 40 anos de idade.
A empresa planeja coletar amostras aleatórias de 50 funcionários de cada escritório. Eles vão analisar a diferença entre as proporções de funcionários que têm menos de 40 anos em cada amostra left parenthesis, p, with, hat, on top, start subscript, start text, M, end text, end subscript, minus, p, with, hat, on top, start subscript, start text, D, end text, end subscript, right parenthesis.
A empresa se pergunta qual é a probabilidade de a diferença entre as duas amostras ser maior que 10 pontos percentuais.
Quer participar da conversa?
Nenhuma postagem por enquanto.