Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 11
Lição 1: Como construir um intervalo de confiança para uma média da população- Introdução ao T estatístico
- Simulação mostrando a importância do T estatístico
- Condições para intervalos t válidos
- Referência: condições para inferência de uma média
- Condições para um intervalo t de uma média
- Exemplo: como calcular o valor t crítico
- Como calcular o valor crítico t* para um nível de confiança desejado
- Exemplo: como construir um intervalo t para uma média
- Como calcular um intervalo t para uma média
- Intervalo de confiança para uma média com dados emparelhados
- Como criar um intervalo t para dados emparelhados
- Como interpretar um intervalo de confiança para uma média
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Como criar um intervalo t para dados emparelhados
Em alguns estudos, fazemos duas observações do mesmo indivíduo. Por exemplo, podemos verificar a pontuação pré-teste e pós-teste de cada aluno em um curso. Em outros estudos, podemos fazer uma observação de dois indivíduos similares. Por exemplo, alguns testes farmacêuticos envolvem emparelhar indivíduos semelhantes para que um receba o remédio e o outro receba um placebo.
Nos dois tipos de estudo, estamos trabalhando com dados emparelhados, e geralmente quando trabalhamos com dados emparelhados estamos interessados na diferença entre cada um dos pares—por exemplo, a diferença entre os dados pré e pós-teste, ou a diferença entre os dados com o remédio ou com o placebo.
Se certas condições forem atendidas, podemos construir um intervalo t para estimar a média dessas diferenças e tirar conclusões.
Neste artigo vamos analisar dois exemplos de aplicação de um intervalo t para dados emparelhados. Importante: você terá a chance de resolver o segundo exemplo sozinho, para garantir que entendeu as ideias principais.
Exemplo 1
Uma revista para corredores queria avaliar dois relógios — relógio A e relógio B — que usam o sistema de posicionamento global (GPS) para calcular a distância que alguém corre. Eles notaram que os relógios não costumavam concordar na distância que alguém percorreu em uma determinada corrida.
A revista usou uma amostra aleatória de 5 assinantes e pediu a eles que corressem um percurso de 10 quilômetros usando os dois relógios ao mesmo tempo (todos concordaram em participar). No final das corridas, os participantes registraram a distância que cada relógio informou como percorrida. Aqui estão os dados (todas as distâncias estão em quilômetros):
Corredor | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Relógio A | 9, comma, 8 | 9, comma, 8 | 10, comma, 1 | 10, comma, 1 | 10, comma, 2 |
Relógio B | 10, comma, 1 | 10 | 10, comma, 2 | 9, comma, 9 | 10, comma, 1 |
Construa um intervalo de confiança de 95, percent para estimar a diferença média nas distâncias registradas pelos relógios. O intervalo sugere que há diferença entre os dois relógios?
Etapa 1: calcule as diferenças
Embora pareça que temos dois conjuntos de dados - relógio A e relógio B - esses dados não vieram de duas amostras independentes. A revista usou uma amostra única de 5 corredores, e cada corredor usou os dois relógios, portanto isso é um planejamento de pares correspondentes. O conjunto único de dados em que estamos interessados é a diferença entre o relógio A e o relógio B para cada corredor. Vamos definir essa variável como start text, d, i, f, e, r, e, n, ç, a, end text, equals, start text, B, end text, minus, start text, A, end text e calcular a diferença para cada corredor:
Corredor | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Relógio A | 9, comma, 8 | 9, comma, 8 | 10, comma, 1 | 10, comma, 1 | 10, comma, 2 |
Relógio B | 10, comma, 1 | 10 | 10, comma, 2 | 9, comma, 9 | 10, comma, 1 |
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesis | 0, comma, 3 | 0, comma, 2 | 0, comma, 1 | minus, 0, comma, 2 | minus, 0, comma, 1 |
Conceito-chave: quando trabalhamos com dados emparelhados, estamos mais interessados na distribuição das diferenças.
Etapa 2: verifique as condições
Nós queremos usar essas n, equals, 5 diferenças para construir um intervalo de confiança para a diferença média. Como nós não sabemos o desvio-padrão das diferenças da população, teremos que usar o desvio-padrão amostral em seu lugar. Isso torna apropriado o uso de um intervalo t ao invés de um intervalo z para estimar a diferença média. Vamos verificar as condições para a criação de um intervalo t.
- Aleatoriedade: a revista colheu uma amostra aleatória dos seus assinantes.
- Normalidade: como nossa amostra de n, equals, 5 corredores é pequena, nós precisamos colocar os dados em um gráfico. As diferenças são razoavelmente simétricas, sem outliers, portanto deve ser seguro prosseguir.
- Independência: é razoável assumir a independência entre as medições de cada corredor. Eles foram selecionados ao acaso e não podem influenciar nos resultados uns dos outros.
Etapa 3: construa o intervalo
Aqui estão os dados:
Corredor | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Relógio A | 9, comma, 8 | 9, comma, 8 | 10, comma, 1 | 10, comma, 1 | 10, comma, 2 |
Relógio B | 10, comma, 1 | 10, comma, 0 | 10, comma, 2 | 9, comma, 9 | 10, comma, 1 |
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesis | 0, comma, 3 | 0, comma, 2 | 0, comma, 1 | minus, 0, comma, 2 | minus, 0, comma, 1 |
Aqui estão as estatísticas resumidas:
Média | Desvio-padrão | |
---|---|---|
Relógio A | x, with, \bar, on top, start subscript, start text, A, end text, end subscript, equals, 10, comma, 00 | s, start subscript, start text, A, end text, end subscript, approximately equals, 0, comma, 19 |
Relógio B | x, with, \bar, on top, start subscript, start text, B, end text, end subscript, equals, 10, comma, 06 | s, start subscript, start text, B, end text, end subscript, approximately equals, 0, comma, 11 |
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesis | x, with, \bar, on top, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 06 | s, start subscript, start text, D, i, f, end text, end subscript, approximately equals, 0, comma, 21 |
Como queremos construir um intervalo de confiança para a diferença média, nós precisamos apenas das estatísticas resumidas das diferenças.
Nós vamos usar a fórmula para o intervalo t de uma amostra para uma média:
Componentes da fórmula
Nossa estatística é a média amostral x, with, \bar, on top, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 06, start text, space, k, m, end text.
Nosso tamanho amostral é n, equals, 5 corredores.
Nosso desvio-padrão amostral é s, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 21, start text, space, k, m, end text.
Nossos graus de liberdade são start text, g, l, end text, equals, 5, minus, 1, equals, 4, então para 95, percent de confiança nosso valor crítico é t, start superscript, times, end superscript, equals, 2, comma, 776.
Cálculos:
Intervalo approximately equals, left parenthesis, minus, 0, comma, 20, ;, 0, comma, 32, right parenthesis
Etapa 4: interprete o intervalo
Esse intervalo sugere que há uma diferença entre os dois relógios?
Nós temos 95, percent de confiança de que o intervalo left parenthesis, minus, 0, comma, 20, ;, 0, comma, 32, right parenthesis captura a diferença média entre as distâncias (em quilômetros) registradas pelos relógios nessas corridas. Note que o intervalo contém 0, start text, space, k, m, end text — que representa diferença nula — então é plausível que não haja diferença entre as distâncias registradas pelos relógios A e B.
Se o intervalo estivesse inteiramente acima de 0 (todos valores positivos), ou inteiramente abaixo de 0 (todos valores negativos), então isso sugeriria a existência de uma diferença entre os dois relógios.
Exemplo 2 — Experimente!
Um site educacional oferece um programa de treinamento para o vestibular. Usuários do programa fazem uma prova antes e depois do curso. Aqui estão as notas e os progressos de uma amostra aleatória de 6 usuários:
Usuário | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Antes | 140 | 152 | 153 | 159 | 150 | 146 |
Depois | 150 | 159 | 170 | 164 | 148 | 166 |
Progresso left parenthesis, start text, d, e, p, o, i, s, end text, minus, start text, a, n, t, e, s, end text, right parenthesis | 10 | 7 | 17 | 5 | minus, 2 | 20 |
Aqui estão as estatísticas resumidas:
Média | Desvio-padrão | |
---|---|---|
Antes | x, with, \bar, on top, start subscript, start text, a, n, t, e, s, end text, end subscript, equals, 150 | s, start subscript, start text, a, n, t, e, s, end text, end subscript, approximately equals, 6, comma, 48 |
Depois | x, with, \bar, on top, start subscript, start text, d, e, p, o, i, s, end text, end subscript, equals, 159, comma, 5 | s, start subscript, start text, d, e, p, o, i, s, end text, end subscript, approximately equals, 8, comma, 89 |
Progresso left parenthesis, start text, d, e, p, o, i, s, end text, minus, start text, a, n, t, e, s, end text, right parenthesis | x, with, \bar, on top, start subscript, start text, p, r, o, g, r, e, s, s, o, end text, end subscript, equals, 9, comma, 5 | s, start subscript, start text, p, r, o, g, r, e, s, s, o, end text, end subscript, approximately equals, 8, comma, 07 |
Os criadores do site afirmam que este intervalo oferece fortes evidências de que usar o programa deles causa um aumento nas notas do usuário.
Quer participar da conversa?
Nenhuma postagem por enquanto.