If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como criar um intervalo t para dados emparelhados

Em alguns estudos, fazemos duas observações do mesmo indivíduo. Por exemplo, podemos verificar a pontuação pré-teste e pós-teste de cada aluno em um curso. Em outros estudos, podemos fazer uma observação de dois indivíduos similares. Por exemplo, alguns testes farmacêuticos envolvem emparelhar indivíduos semelhantes para que um receba o remédio e o outro receba um placebo.
Nos dois tipos de estudo, estamos trabalhando com dados emparelhados, e geralmente quando trabalhamos com dados emparelhados estamos interessados na diferença entre cada um dos pares—por exemplo, a diferença entre os dados pré e pós-teste, ou a diferença entre os dados com o remédio ou com o placebo.
Se certas condições forem atendidas, podemos construir um intervalo t para estimar a média dessas diferenças e tirar conclusões.
Neste artigo vamos analisar dois exemplos de aplicação de um intervalo t para dados emparelhados. Importante: você terá a chance de resolver o segundo exemplo sozinho, para garantir que entendeu as ideias principais.

Exemplo 1

Uma revista para corredores queria avaliar dois relógios — relógio A e relógio B — que usam o sistema de posicionamento global (GPS) para calcular a distância que alguém corre. Eles notaram que os relógios não costumavam concordar na distância que alguém percorreu em uma determinada corrida.
A revista usou uma amostra aleatória de 5 assinantes e pediu a eles que corressem um percurso de 10 quilômetros usando os dois relógios ao mesmo tempo (todos concordaram em participar). No final das corridas, os participantes registraram a distância que cada relógio informou como percorrida. Aqui estão os dados (todas as distâncias estão em quilômetros):
Corredor12345
Relógio A9,89,810,110,110,2
Relógio B10,11010,29,910,1
Construa um intervalo de confiança de 95% para estimar a diferença média nas distâncias registradas pelos relógios. O intervalo sugere que há diferença entre os dois relógios?

Etapa 1: calcule as diferenças

Embora pareça que temos dois conjuntos de dados - relógio A e relógio B - esses dados não vieram de duas amostras independentes. A revista usou uma amostra única de 5 corredores, e cada corredor usou os dois relógios, portanto isso é um planejamento de pares correspondentes. O conjunto único de dados em que estamos interessados é a diferença entre o relógio A e o relógio B para cada corredor. Vamos definir essa variável como diferença=BA e calcular a diferença para cada corredor:
Corredor12345
Relógio A9,89,810,110,110,2
Relógio B10,11010,29,910,1
Diferença (BA)0,30,20,10,20,1
Conceito-chave: quando trabalhamos com dados emparelhados, estamos mais interessados na distribuição das diferenças.

Etapa 2: verifique as condições

Nós queremos usar essas n=5 diferenças para construir um intervalo de confiança para a diferença média. Como nós não sabemos o desvio-padrão das diferenças da população, teremos que usar o desvio-padrão amostral em seu lugar. Isso torna apropriado o uso de um intervalo t ao invés de um intervalo z para estimar a diferença média. Vamos verificar as condições para a criação de um intervalo t.
  • Aleatoriedade: a revista colheu uma amostra aleatória dos seus assinantes.
  • Normalidade: como nossa amostra de n=5 corredores é pequena, nós precisamos colocar os dados em um gráfico. As diferenças são razoavelmente simétricas, sem outliers, portanto deve ser seguro prosseguir.
  • Independência: é razoável assumir a independência entre as medições de cada corredor. Eles foram selecionados ao acaso e não podem influenciar nos resultados uns dos outros.

Etapa 3: construa o intervalo

Aqui estão os dados:
Corredor12345
Relógio A9,89,810,110,110,2
Relógio B10,110,010,29,910,1
Diferença (BA)0,30,20,10,20,1
Aqui estão as estatísticas resumidas:
MédiaDesvio-padrão
Relógio Ax¯A=10,00sA0,19
Relógio Bx¯B=10,06sB0,11
Diferença (BA)x¯Dif=0,06sDif0,21
Como queremos construir um intervalo de confiança para a diferença média, nós precisamos apenas das estatísticas resumidas das diferenças.
Nós vamos usar a fórmula para o intervalo t de uma amostra para uma média:
(estatística)±(valorcrítico)(desvio-padrãoda estatística)x¯Dif± tsDifn
Componentes da fórmula
Nossa estatística é a média amostral x¯Dif=0,06 km.
Nosso tamanho amostral é n=5 corredores.
Nosso desvio-padrão amostral é sDif=0,21 km.
Nossos graus de liberdade são gl=51=4, então para 95% de confiança nosso valor crítico é t=2,776.
Cálculos:
x¯Dif± tsDifn0,06±2,7760,2150,06±(2,776)(0,094)0,06±0,2610,060,261=0,2010,06+0,261=0,321
Intervalo (0,20;0,32)

Etapa 4: interprete o intervalo

Esse intervalo sugere que há uma diferença entre os dois relógios?
Nós temos 95% de confiança de que o intervalo (0,20;0,32) captura a diferença média entre as distâncias (em quilômetros) registradas pelos relógios nessas corridas. Note que o intervalo contém 0 km — que representa diferença nula — então é plausível que não haja diferença entre as distâncias registradas pelos relógios A e B.
Se o intervalo estivesse inteiramente acima de 0 (todos valores positivos), ou inteiramente abaixo de 0 (todos valores negativos), então isso sugeriria a existência de uma diferença entre os dois relógios.

Exemplo 2 — Experimente!

Um site educacional oferece um programa de treinamento para o vestibular. Usuários do programa fazem uma prova antes e depois do curso. Aqui estão as notas e os progressos de uma amostra aleatória de 6 usuários:
Usuário123456
Antes140152153159150146
Depois150159170164148166
Progresso (depoisantes)107175220
Aqui estão as estatísticas resumidas:
MédiaDesvio-padrão
Antesx¯antes=150santes6,48
Depoisx¯depois=159,5sdepois8,89
Progresso (depoisantes)x¯progresso=9,5sprogresso8,07
Problema A (Exemplo 2)
Com base nessa amostra, qual é um intervalo de confiança de 95% para a melhora média do desempenho dos usuários desse programa?
Escolha 1 resposta:

Problema B (Exemplo 2)
É plausível que os usuários desse programa não tenham tido nenhum progresso médio?
Escolha 1 resposta:

Os criadores do site afirmam que este intervalo oferece fortes evidências de que usar o programa deles causa um aumento nas notas do usuário.
Problema C (Exemplo 2)
Essa é uma conclusão válida?
Escolha 1 resposta:

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.