Conteúdo principal
Curso: Estatística Avançada > Unidade 13
Lição 2: Teste do coeficiente angular de um modelo de regressão- Calcular o T estatístico para a inclinação de uma reta de regressão
- Estatística de teste para inclinação
- Como usar um valor-p para tirar conclusões em um teste sobre inclinação
- Como usar o intervalo de confiança para testar uma inclinação
- Como tirar conclusões sobre uma inclinação
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Calcular o T estatístico para a inclinação de uma reta de regressão
Calcule a estatística de teste em um teste sobre a inclinação de uma reta de regressão.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA7MP - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda
a mais um vídeo da Khan Academy Brasil! Neste vídeo, nós vamos resolver
um exercício sobre a estatística "t" da inclinação de uma linha de regressão. E esta questão diz o seguinte: Júlio obteve uma amostra
aleatória de dados sobre quanto tempo levou
cada um dos 24 alunos para completar um jogo
de reação cronometrado e um jogo de memória cronometrado. Ele percebeu uma relação linear positiva entre os tempos de cada tarefa. Aqui está a saída de computador dos
dados da amostra. Temos algumas estatísticas calculadas
do tempo de reação e do tempo de memória. Perceba que o computador fez uma regressão pelos dados que ele coletou. Somos informados, ainda, para assumir que todas as condições para a inferência
foram atendidas. Calcule a estatística de teste que deveria
ser usada para testar uma hipótese nula de que a inclinação da população
é realmente zero. Então, pause esse vídeo
e tente fazer isso. E aí, fez?
Vamos fazer juntos agora? Vamos apenas nos certificar de que
entendemos o que está acontecendo. Vamos primeiro pensar sobre a população. Eu vou fazer isso bem aqui. Na população, pode haver alguma relação
linear verdadeira. Então, em teoria, no eixo "x" nós temos
o tempo de reação e no eixo "y" nós temos o
tempo de memória. Se você fosse capaz de traçar
cada único ponto de dados possíveis, podemos ter aqui algo chegando ao infinito
ou quase infinito. Então, seria muito difícil
fazer isso, não é? Mas, se fosse possível fazer isso, poderíamos dizer que sim, na verdade,
existe uma relação linear positiva. E é assim. Aí, você poderia descrever esta
linha de regressão como "y" chapéu, é uma linha de regressão, e isso aqui sendo igual a um parâmetro
verdadeiro da população que seria essa interceptação com "y". Nós podemos chamar isso de alfa (α), mais outro parâmetro verdadeiro
da população, que é a inclinação desta
linha de regressão, podemos chamar de beta (β),
vezes "x". Agora, não sabemos se existe
uma verdade universal para a relação linear entre o tempo
de reação e o tempo de memória, mas podemos tentar estimar isso. E é isso que Júlio está tentando fazer. Ele está pegando uma amostra de 24, ou seja, uma amostra com 24 dados,
24 pontos de dados. E é muito mais fácil visualizar isso em um gráfico de dispersão
como este, não é? Então, a gente coloca aqui: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 e 24. E aí, inserimos estes pontos
de dados no computador que ele vai fazer uma linha de regressão e vai tentar minimizar a distância
quadrada de todos os pontos. Fazendo isso, vamos ter uma
linha de regressão que se parece com isto. Esta linha de regressão pode
ser descrita como uma estimativa da verdadeira
interceptação com o "y". Isso seria realmente uma estatística, ou seja, vamos estimar um parâmetro. Como esta é uma linha de regressão,
a gente pode, ainda, descrever esta linha de regressão através de uma estimativa da verdadeira
interceptação com "y". Isso é realmente uma estatística, ou seja, vamos estimar este parâmetro. Também vamos realizar uma estimativa da verdadeira inclinação da
linha de regressão. Este "b" é apenas uma estatística que está tentando estimar o verdadeiro
parâmetro β. Agora, quando a gente inserir estes
dados no computador, teremos valores para "a" e "b" bem aqui. "a" é igual a isto, que é o
coeficiente constante. Também temos o coeficiente da reação, e isso está apenas nos dizendo a relação entre o tempo de memória e o
tempo de reação. Ou seja, para uma mudança no "x",
no tempo de memória, quanto poderíamos esperar de
mudança em "y", no tempo de reação? Esta aqui é realmente a estimativa da
inclinação da linha de regressão. Agora, você pode imaginar, cada vez
que você pega uma amostra diferente, você pode obter diferentes estimativas
dessa coisa. E quando estamos fazendo
estatística inferencial, nós estabelecemos hipóteses. Você configura uma hipótese nula
e uma hipótese alternativa. A hipótese nula é sempre sem
mudança aqui. Sendo assim, quando estamos
lidando com regressões suspeitamos de que existe uma
relação linear positiva. Então, a hipótese nula é quando assumimos que não há uma relação linear positiva, mesmo os dados apresentados
mostrando que há. Sendo assim, a hipótese nula diz
que a verdadeira inclinação da verdadeira linha de regressão, ou seja, este parâmetro bem aqui,
é igual a zero. Logo, β é igual a zero. Assim, a hipótese nula nos diz que a verdadeira linha de regressão pode
ser parecida com isso. E um detalhe, isso é pouco
dependente do valor de "x". Agora, se você suspeitar que há uma
relação linear positiva, você poderia dizer algo como: "Bem, a hipótese alternativa é que β
é maior que zero." Ou se você suspeitar que existe apenas
alguma relação linear em que você não sabe se é
positiva ou negativa, você pode dizer apenas que o β
é diferente de zero. Mas aqui diz que ele percebeu ou suspeita que há uma relação linear positiva. Então, esta é a hipótese alternativa. Bem, precisamos testar essas hipóteses. E o que precisamos fazer para testar
a hipótese nula? Já fizemos isso várias vezes, nós precisamos encontrar uma
estatística de teste que está associada com a estatística
para "b" que você realmente conseguiu. De uma forma ideal, a gente pega o "b" e subtrai a inclinação assumida
na hipótese nula. Ou seja, temos a inclinação da linha
de regressão obtida menos a inclinação assumida
a partir da hipótese nula. E aí, dividimos pelo desvio padrão
da distribuição de amostragem da inclinação da linha de regressão. Ao fazer isso, estamos obtendo
uma estatística "z" aqui. Agora, o problema é que
não sabemos exatamente qual é o desvio padrão
da distribuição amostral. Mas podemos estimar isso. Sendo assim, pegamos a inclinação
que encontramos através da linha de regressão da amostra menos a inclinação que estamos
assumindo na hipótese nula, que vai ser igual a zero. Então, sabemos o que estamos assumindo e podemos calcular o erro padrão
da distribuição amostral. Um detalhe legal é que o computador
já fez isso por nós. E esta é uma estimativa disso. E sabemos qual é este número. Sendo assim, sabemos o que são
todos estes números. Mas, se você estiver usando uma estimativa
do desvio padrão da distribuição de amostragem,
já vimos isso antes. Quando a gente faz uma
estatística inferencial para médias, é apropriado usar uma estatística "t". Dito isso, pause o vídeo e determine
o resultado desta expressão. E aí, já fez?
Vamos fazer aqui? Isso vai ser igual à inclinação
para a linha de regressão da amostra, que nós sabemos que a 14,686, menos o verdadeiro parâmetro
de população assumido que, nesse caso, é a inclinação da linha
de regressão verdadeira. Mas estamos assumindo que isto é zero,
não é? Então, temos isto menos zero. Aí, dividimos isso pelo erro padrão,
que vai ser, podemos usar isso como
erro padrão para "b". Então, é isso dividido por 13,329. Então, nós temos aqui 14,686 dividido por 13,329. E se a gente assumir que estamos
fazendo um teste unilateral o que faremos é pegar esta estatística "t" e pensar sobre os graus de liberdade. E depois calculamos um valor "p". Qual é a probabilidade de obter um
resultado tão extremo ou mais extremo em que "t" é igual a zero? Ou qual é a probabilidade de obter
uma estatística "t" tão alta ou maior? Bem, este seria o valor "p". E se estiver abaixo de algum limite,
isso é bem provável de acontecer. Então, rejeitaríamos a hipótese nula e aí, teríamos como sugestão alternativa. Mas a questão não está pedindo
para fazer isso. Está pedindo apenas para calcular uma estatística de teste apropriada. E é o que acabamos de fazer. Enfim, meu amigo ou minha amiga, espero
que você tenha compreendido tudo direitinho. Mais uma vez, quero deixar para você
um grande abraço e até a próxima!