If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Teste t de duas amostras para a diferença entre médias

Teste de hipótese para a diferença entre médias de duas populações.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA12MC – Olá, meu amigo ou minha amiga. Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. E, neste vídeo, vamos resolver um exemplo sobre o teste t para a diferença entre as médias de duas amostras. Este exemplo diz o seguinte: Caio planta tomates em dois campos separados. Quando os tomates estão prontos para serem colhidos, ele está curioso para saber se os tamanhos dos pés de tomate diferem entre os dois campos. Ele pega uma amostra aleatória de plantas de cada campo e mede a altura das plantas. Aqui está um resumo dos resultados. Bem, o que eu quero que você faça aqui agora é pausar este vídeo e realizar um teste t de duas amostras aqui. Nós vamos assumir que todas as condições para a inferência foram atendidas, ou seja, a condição aleatória, a condição normal e a condição de independência foram atendidas. Vamos supor também que estamos trabalhando com um nível de significância de 5%, ou seja, alfa é igual a 0,05. Então, pause este vídeo aqui e realize o teste t de duas amostras para ver se há evidências de que os tamanhos dos pés de tomate diferem entre os campos. Ok, vamos fazer isso juntos aqui agora. Então, como sempre, vamos primeiro construir nossa hipótese nula. E essa vai ser a situação em que não há diferença entre os tamanhos médios. Sendo assim, teremos aqui que o tamanho médio no campo A é igual ao tamanho médio no campo B. Agora, qual é a nossa hipótese alternativa? Bem, ele quer ver se os tamanhos dos pés de tomate diferem entre os dois campos. Ele não está dizendo se A é maior que B, ou se B é maior que A. Sendo assim, a hipótese alternativa estaria em torno da suspeita de que a média de A é diferente da média de B. Agora, para fazer esse teste t de duas amostras, assumimos a hipótese nula. E não se esqueça de que estamos assumindo que todas as nossas condições para a inferência foram atendidas. O que queremos aqui é calcular uma estatística t com base nos dados de amostra que temos. Assim, a nossa estatística t vai ser igual à diferença entre as médias da amostra sobre nossa estimativa do desvio-padrão da distribuição amostral da diferença das médias da amostra. Isso aqui será igual à raiz quadrada de: o desvio-padrão da amostra A ao quadrado sobre o tamanho da amostra A mais o desvio padrão da amostra B ao quadrado sobre o tamanho da amostra B. Vamos ver aqui. Temos todos os números para calcular isso. Esse numerador vai ser igual a 1,3 menos 1,6 sobre a raiz quadrada de... vamos ver. O desvio-padrão da amostra do campo A é 0,5. Se você elevar isso ao quadrado, teremos aqui 0,25. e isso sobre o tamanho da amostra do campo A, que é 22, mais 0,3 ao quadrado, que é 0,09, sobre o tamanho da amostra do campo B, que é 24. Vamos pegar a calculadora aqui. Isso vai ser aproximadamente menos 2,44. Então, colocamos aqui aproximadamente “-2,44”. Agora, se você pensar sobre uma distribuição t (e, inclusive, vamos usar nossa calculadora para descobrir essa probabilidade, mas antes disso podemos pensar no gráfico da distribuição t), teremos aqui a média da nossa distribuição t. E com isso encontramos um valor, uma estatística t igual a menos 2,44. Sabendo disso, o que queremos aqui é encontrar a probabilidade dessa distribuição t de conseguir algo pelo menos neste extremo. Bem, essa probabilidade corresponde a essa área aqui. Também seria essa área se tivermos encontrado 2,44 acima da média. Sendo assim, devemos multiplicar por dois para considerar esta área aqui também. Bem, vamos escrever aqui o que a gente quer. Eu quero calcular a probabilidade de obter um valor t. Bem, eu vou colocar o valor absoluto aqui, ok? Então, qual é a probabilidade de encontrar um módulo de t sendo maior ou igual a 2,44? Isso vai ser aproximadamente igual a... vou pegar a calculadora aqui. Eu vou escolher a função de distribuição cumulativa para nossa distribuição t. Vamos colocar os dados aqui. O limite inferior é um número muito, muito negativo. Sendo assim, você pode ver isso como um infinito negativo. Já o limite superior é menos 2,44. Agora, temos quantos graus de liberdade? Bem, se adotarmos aqui uma abordagem conservadora, será a menor dentre as duas amostras menos um. Bem, a menor das duas amostras é 22. Então, temos aqui 22 menos 1, e é 21. Então, colocamos o 21 aqui. Agora posso colar e obter esse valor. Se eu multiplicar isso aqui por dois, porque isso me dá a probabilidade de conseguir algo mais baixo do que isso, mas eu também quero pensar sobre a probabilidade de conseguir algo igual a 2,44 ou maior acima da média da nossa distribuição t, então colocamos vezes dois aqui. E isso vai ser aproximadamente igual a 0,024. Então, temos aqui aproximadamente 0,024. Agora o que temos que fazer é pensar no meu nível de significância. E você pode ver muito claramente isso bem aqui. Isso é igual ao nosso valor p. Nosso valor p nesta situação é claramente menor do que o nosso nível de significância. Nós assumimos aqui a nossa hipótese nula sendo verdadeira, só que a gente tem uma probabilidade muito baixa, muito abaixo do nosso limite, para isso acontecer. Então, nós vamos rejeitar nossa hipótese nula e isso vai sugerir a hipótese alternativa, ou seja, de que realmente existe uma diferença entre os tamanhos das plantas de tomate nos dois campos. Enfim, meu amigo ou minha amiga, eu espero que você tenha compreendido tudo direitinho. E, mais uma vez, eu quero deixar para você um grande abraço, e até a próxima!