If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Calcular o T estatístico para a inclinação de uma reta de regressão

Calcule a estatística de teste em um teste sobre a inclinação de uma reta de regressão.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA7MP - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil! Neste vídeo, nós vamos resolver um exercício sobre a estatística "t" da inclinação de uma linha de regressão. E esta questão diz o seguinte: Júlio obteve uma amostra aleatória de dados sobre quanto tempo levou cada um dos 24 alunos para completar um jogo de reação cronometrado e um jogo de memória cronometrado. Ele percebeu uma relação linear positiva entre os tempos de cada tarefa. Aqui está a saída de computador dos dados da amostra. Temos algumas estatísticas calculadas do tempo de reação e do tempo de memória. Perceba que o computador fez uma regressão pelos dados que ele coletou. Somos informados, ainda, para assumir que todas as condições para a inferência foram atendidas. Calcule a estatística de teste que deveria ser usada para testar uma hipótese nula de que a inclinação da população é realmente zero. Então, pause esse vídeo e tente fazer isso. E aí, fez? Vamos fazer juntos agora? Vamos apenas nos certificar de que entendemos o que está acontecendo. Vamos primeiro pensar sobre a população. Eu vou fazer isso bem aqui. Na população, pode haver alguma relação linear verdadeira. Então, em teoria, no eixo "x" nós temos o tempo de reação e no eixo "y" nós temos o tempo de memória. Se você fosse capaz de traçar cada único ponto de dados possíveis, podemos ter aqui algo chegando ao infinito ou quase infinito. Então, seria muito difícil fazer isso, não é? Mas, se fosse possível fazer isso, poderíamos dizer que sim, na verdade, existe uma relação linear positiva. E é assim. Aí, você poderia descrever esta linha de regressão como "y" chapéu, é uma linha de regressão, e isso aqui sendo igual a um parâmetro verdadeiro da população que seria essa interceptação com "y". Nós podemos chamar isso de alfa (α), mais outro parâmetro verdadeiro da população, que é a inclinação desta linha de regressão, podemos chamar de beta (β), vezes "x". Agora, não sabemos se existe uma verdade universal para a relação linear entre o tempo de reação e o tempo de memória, mas podemos tentar estimar isso. E é isso que Júlio está tentando fazer. Ele está pegando uma amostra de 24, ou seja, uma amostra com 24 dados, 24 pontos de dados. E é muito mais fácil visualizar isso em um gráfico de dispersão como este, não é? Então, a gente coloca aqui: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 e 24. E aí, inserimos estes pontos de dados no computador que ele vai fazer uma linha de regressão e vai tentar minimizar a distância quadrada de todos os pontos. Fazendo isso, vamos ter uma linha de regressão que se parece com isto. Esta linha de regressão pode ser descrita como uma estimativa da verdadeira interceptação com o "y". Isso seria realmente uma estatística, ou seja, vamos estimar um parâmetro. Como esta é uma linha de regressão, a gente pode, ainda, descrever esta linha de regressão através de uma estimativa da verdadeira interceptação com "y". Isso é realmente uma estatística, ou seja, vamos estimar este parâmetro. Também vamos realizar uma estimativa da verdadeira inclinação da linha de regressão. Este "b" é apenas uma estatística que está tentando estimar o verdadeiro parâmetro β. Agora, quando a gente inserir estes dados no computador, teremos valores para "a" e "b" bem aqui. "a" é igual a isto, que é o coeficiente constante. Também temos o coeficiente da reação, e isso está apenas nos dizendo a relação entre o tempo de memória e o tempo de reação. Ou seja, para uma mudança no "x", no tempo de memória, quanto poderíamos esperar de mudança em "y", no tempo de reação? Esta aqui é realmente a estimativa da inclinação da linha de regressão. Agora, você pode imaginar, cada vez que você pega uma amostra diferente, você pode obter diferentes estimativas dessa coisa. E quando estamos fazendo estatística inferencial, nós estabelecemos hipóteses. Você configura uma hipótese nula e uma hipótese alternativa. A hipótese nula é sempre sem mudança aqui. Sendo assim, quando estamos lidando com regressões suspeitamos de que existe uma relação linear positiva. Então, a hipótese nula é quando assumimos que não há uma relação linear positiva, mesmo os dados apresentados mostrando que há. Sendo assim, a hipótese nula diz que a verdadeira inclinação da verdadeira linha de regressão, ou seja, este parâmetro bem aqui, é igual a zero. Logo, β é igual a zero. Assim, a hipótese nula nos diz que a verdadeira linha de regressão pode ser parecida com isso. E um detalhe, isso é pouco dependente do valor de "x". Agora, se você suspeitar que há uma relação linear positiva, você poderia dizer algo como: "Bem, a hipótese alternativa é que β é maior que zero." Ou se você suspeitar que existe apenas alguma relação linear em que você não sabe se é positiva ou negativa, você pode dizer apenas que o β é diferente de zero. Mas aqui diz que ele percebeu ou suspeita que há uma relação linear positiva. Então, esta é a hipótese alternativa. Bem, precisamos testar essas hipóteses. E o que precisamos fazer para testar a hipótese nula? Já fizemos isso várias vezes, nós precisamos encontrar uma estatística de teste que está associada com a estatística para "b" que você realmente conseguiu. De uma forma ideal, a gente pega o "b" e subtrai a inclinação assumida na hipótese nula. Ou seja, temos a inclinação da linha de regressão obtida menos a inclinação assumida a partir da hipótese nula. E aí, dividimos pelo desvio padrão da distribuição de amostragem da inclinação da linha de regressão. Ao fazer isso, estamos obtendo uma estatística "z" aqui. Agora, o problema é que não sabemos exatamente qual é o desvio padrão da distribuição amostral. Mas podemos estimar isso. Sendo assim, pegamos a inclinação que encontramos através da linha de regressão da amostra menos a inclinação que estamos assumindo na hipótese nula, que vai ser igual a zero. Então, sabemos o que estamos assumindo e podemos calcular o erro padrão da distribuição amostral. Um detalhe legal é que o computador já fez isso por nós. E esta é uma estimativa disso. E sabemos qual é este número. Sendo assim, sabemos o que são todos estes números. Mas, se você estiver usando uma estimativa do desvio padrão da distribuição de amostragem, já vimos isso antes. Quando a gente faz uma estatística inferencial para médias, é apropriado usar uma estatística "t". Dito isso, pause o vídeo e determine o resultado desta expressão. E aí, já fez? Vamos fazer aqui? Isso vai ser igual à inclinação para a linha de regressão da amostra, que nós sabemos que a 14,686, menos o verdadeiro parâmetro de população assumido que, nesse caso, é a inclinação da linha de regressão verdadeira. Mas estamos assumindo que isto é zero, não é? Então, temos isto menos zero. Aí, dividimos isso pelo erro padrão, que vai ser, podemos usar isso como erro padrão para "b". Então, é isso dividido por 13,329. Então, nós temos aqui 14,686 dividido por 13,329. E se a gente assumir que estamos fazendo um teste unilateral o que faremos é pegar esta estatística "t" e pensar sobre os graus de liberdade. E depois calculamos um valor "p". Qual é a probabilidade de obter um resultado tão extremo ou mais extremo em que "t" é igual a zero? Ou qual é a probabilidade de obter uma estatística "t" tão alta ou maior? Bem, este seria o valor "p". E se estiver abaixo de algum limite, isso é bem provável de acontecer. Então, rejeitaríamos a hipótese nula e aí, teríamos como sugestão alternativa. Mas a questão não está pedindo para fazer isso. Está pedindo apenas para calcular uma estatística de teste apropriada. E é o que acabamos de fazer. Enfim, meu amigo ou minha amiga, espero que você tenha compreendido tudo direitinho. Mais uma vez, quero deixar para você um grande abraço e até a próxima!