If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como criar um intervalo t para dados emparelhados

Em alguns estudos, fazemos duas observações do mesmo indivíduo. Por exemplo, podemos verificar a pontuação pré-teste e pós-teste de cada aluno em um curso. Em outros estudos, podemos fazer uma observação de dois indivíduos similares. Por exemplo, alguns testes farmacêuticos envolvem emparelhar indivíduos semelhantes para que um receba o remédio e o outro receba um placebo.
Nos dois tipos de estudo, estamos trabalhando com dados emparelhados, e geralmente quando trabalhamos com dados emparelhados estamos interessados na diferença entre cada um dos pares—por exemplo, a diferença entre os dados pré e pós-teste, ou a diferença entre os dados com o remédio ou com o placebo.
Se certas condições forem atendidas, podemos construir um intervalo t para estimar a média dessas diferenças e tirar conclusões.
Neste artigo vamos analisar dois exemplos de aplicação de um intervalo t para dados emparelhados. Importante: você terá a chance de resolver o segundo exemplo sozinho, para garantir que entendeu as ideias principais.

Exemplo 1

Uma revista para corredores queria avaliar dois relógios — relógio A e relógio B — que usam o sistema de posicionamento global (GPS) para calcular a distância que alguém corre. Eles notaram que os relógios não costumavam concordar na distância que alguém percorreu em uma determinada corrida.
A revista usou uma amostra aleatória de 5 assinantes e pediu a eles que corressem um percurso de 10 quilômetros usando os dois relógios ao mesmo tempo (todos concordaram em participar). No final das corridas, os participantes registraram a distância que cada relógio informou como percorrida. Aqui estão os dados (todas as distâncias estão em quilômetros):
Corredor12345
Relógio A9, comma, 89, comma, 810, comma, 110, comma, 110, comma, 2
Relógio B10, comma, 11010, comma, 29, comma, 910, comma, 1
Construa um intervalo de confiança de 95, percent para estimar a diferença média nas distâncias registradas pelos relógios. O intervalo sugere que há diferença entre os dois relógios?

Etapa 1: calcule as diferenças

Embora pareça que temos dois conjuntos de dados - relógio A e relógio B - esses dados não vieram de duas amostras independentes. A revista usou uma amostra única de 5 corredores, e cada corredor usou os dois relógios, portanto isso é um planejamento de pares correspondentes. O conjunto único de dados em que estamos interessados é a diferença entre o relógio A e o relógio B para cada corredor. Vamos definir essa variável como start text, d, i, f, e, r, e, n, ç, a, end text, equals, start text, B, end text, minus, start text, A, end text e calcular a diferença para cada corredor:
Corredor12345
Relógio A9, comma, 89, comma, 810, comma, 110, comma, 110, comma, 2
Relógio B10, comma, 11010, comma, 29, comma, 910, comma, 1
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesis0, comma, 30, comma, 20, comma, 1minus, 0, comma, 2minus, 0, comma, 1
Conceito-chave: quando trabalhamos com dados emparelhados, estamos mais interessados na distribuição das diferenças.

Etapa 2: verifique as condições

Nós queremos usar essas n, equals, 5 diferenças para construir um intervalo de confiança para a diferença média. Como nós não sabemos o desvio-padrão das diferenças da população, teremos que usar o desvio-padrão amostral em seu lugar. Isso torna apropriado o uso de um intervalo t ao invés de um intervalo z para estimar a diferença média. Vamos verificar as condições para a criação de um intervalo t.
  • Aleatoriedade: a revista colheu uma amostra aleatória dos seus assinantes.
  • Normalidade: como nossa amostra de n, equals, 5 corredores é pequena, nós precisamos colocar os dados em um gráfico. As diferenças são razoavelmente simétricas, sem outliers, portanto deve ser seguro prosseguir.
  • Independência: é razoável assumir a independência entre as medições de cada corredor. Eles foram selecionados ao acaso e não podem influenciar nos resultados uns dos outros.

Etapa 3: construa o intervalo

Aqui estão os dados:
Corredor12345
Relógio A9, comma, 89, comma, 810, comma, 110, comma, 110, comma, 2
Relógio B10, comma, 110, comma, 010, comma, 29, comma, 910, comma, 1
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesis0, comma, 30, comma, 20, comma, 1minus, 0, comma, 2minus, 0, comma, 1
Aqui estão as estatísticas resumidas:
MédiaDesvio-padrão
Relógio Ax, with, \bar, on top, start subscript, start text, A, end text, end subscript, equals, 10, comma, 00s, start subscript, start text, A, end text, end subscript, approximately equals, 0, comma, 19
Relógio Bx, with, \bar, on top, start subscript, start text, B, end text, end subscript, equals, 10, comma, 06s, start subscript, start text, B, end text, end subscript, approximately equals, 0, comma, 11
Diferença left parenthesis, start text, B, end text, minus, start text, A, end text, right parenthesisx, with, \bar, on top, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 06s, start subscript, start text, D, i, f, end text, end subscript, approximately equals, 0, comma, 21
Como queremos construir um intervalo de confiança para a diferença média, nós precisamos apenas das estatísticas resumidas das diferenças.
Nós vamos usar a fórmula para o intervalo t de uma amostra para uma média:
(estatıˊstica)±(valorcrıˊtico)(desvio-padra˜oda estatıˊstica)xˉDif± tsDifn\begin{aligned} (\text{estatística}) &\pm \left({\text{valor}\atop\text{crítico}}\right)\left({\text{desvio-padrão} \atop\text{da estatística}}\right) \\\\ \bar x_{\text{Dif}} &\pm\ t^{*} \cdot \dfrac{s_{\text{Dif}}}{\sqrt n} \end{aligned}
Componentes da fórmula
Nossa estatística é a média amostral x, with, \bar, on top, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 06, start text, space, k, m, end text.
Nosso tamanho amostral é n, equals, 5 corredores.
Nosso desvio-padrão amostral é s, start subscript, start text, D, i, f, end text, end subscript, equals, 0, comma, 21, start text, space, k, m, end text.
Nossos graus de liberdade são start text, g, l, end text, equals, 5, minus, 1, equals, 4, então para 95, percent de confiança nosso valor crítico é t, start superscript, times, end superscript, equals, 2, comma, 776.
Cálculos:
xˉDif± tsDifn0,06±2,7760,2150,06±(2,776)(0,094)0,06±0,2610,060,261=0,2010,06+0,261=0,321\begin{aligned} \bar x_{\text{Dif}} &\pm\ t^{*} \cdot \dfrac{s_{\text{Dif}}}{\sqrt n} \\\\ 0{,}06 &\pm 2{,}776 \cdot \dfrac{0{,}21}{\sqrt {5}} \\\\ 0{,}06 &\pm (2{,}776)(0{,}094) \\\\ 0{,}06 &\pm 0{,}261 \\\\ 0{,}06 &- 0{,}261=-0{,}201 \\\\ 0{,}06 &+ 0{,}261=0{,}321 \end{aligned}
Intervalo approximately equals, left parenthesis, minus, 0, comma, 20, ;, 0, comma, 32, right parenthesis

Etapa 4: interprete o intervalo

Esse intervalo sugere que há uma diferença entre os dois relógios?
Nós temos 95, percent de confiança de que o intervalo left parenthesis, minus, 0, comma, 20, ;, 0, comma, 32, right parenthesis captura a diferença média entre as distâncias (em quilômetros) registradas pelos relógios nessas corridas. Note que o intervalo contém 0, start text, space, k, m, end text — que representa diferença nula — então é plausível que não haja diferença entre as distâncias registradas pelos relógios A e B.
Se o intervalo estivesse inteiramente acima de 0 (todos valores positivos), ou inteiramente abaixo de 0 (todos valores negativos), então isso sugeriria a existência de uma diferença entre os dois relógios.

Exemplo 2 — Experimente!

Um site educacional oferece um programa de treinamento para o vestibular. Usuários do programa fazem uma prova antes e depois do curso. Aqui estão as notas e os progressos de uma amostra aleatória de 6 usuários:
Usuário123456
Antes140152153159150146
Depois150159170164148166
Progresso left parenthesis, start text, d, e, p, o, i, s, end text, minus, start text, a, n, t, e, s, end text, right parenthesis107175minus, 220
Aqui estão as estatísticas resumidas:
MédiaDesvio-padrão
Antesx, with, \bar, on top, start subscript, start text, a, n, t, e, s, end text, end subscript, equals, 150s, start subscript, start text, a, n, t, e, s, end text, end subscript, approximately equals, 6, comma, 48
Depoisx, with, \bar, on top, start subscript, start text, d, e, p, o, i, s, end text, end subscript, equals, 159, comma, 5s, start subscript, start text, d, e, p, o, i, s, end text, end subscript, approximately equals, 8, comma, 89
Progresso left parenthesis, start text, d, e, p, o, i, s, end text, minus, start text, a, n, t, e, s, end text, right parenthesisx, with, \bar, on top, start subscript, start text, p, r, o, g, r, e, s, s, o, end text, end subscript, equals, 9, comma, 5s, start subscript, start text, p, r, o, g, r, e, s, s, o, end text, end subscript, approximately equals, 8, comma, 07
Problema A (Exemplo 2)
Com base nessa amostra, qual é um intervalo de confiança de 95, percent para a melhora média do desempenho dos usuários desse programa?
Escolha 1 resposta:

Problema B (Exemplo 2)
É plausível que os usuários desse programa não tenham tido nenhum progresso médio?
Escolha 1 resposta:

Os criadores do site afirmam que este intervalo oferece fortes evidências de que usar o programa deles causa um aumento nas notas do usuário.
Problema C (Exemplo 2)
Essa é uma conclusão válida?
Escolha 1 resposta:

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.