Conteúdo principal
Curso: Estatística Avançada > Unidade 13
Lição 2: Teste do coeficiente angular de um modelo de regressão- Calcular o T estatístico para a inclinação de uma reta de regressão
- Estatística de teste para inclinação
- Como usar um valor-p para tirar conclusões em um teste sobre inclinação
- Como usar o intervalo de confiança para testar uma inclinação
- Como tirar conclusões sobre uma inclinação
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Como usar um valor-p para tirar conclusões em um teste sobre inclinação
Tire conclusões em um teste de hipóteses sobre a inclinação de uma reta de regressão de mínimos quadrados.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Nesta aula, vamos resolver um problema sobre como usar o valor "p" para determinar conclusões
em um teste sobre inclinação da linha de regressão. E este exercício diz o seguinte: Ana pegou uma amostra aleatória
de telefones celulares e encontrou uma relação linear positiva entre as velocidades do
processador e os seus preços. Aqui está a saída do computador de análise de regressão de
mínimos quadrados de sua amostra. Então, só para deixar claro
o que está acontecendo, ela pegou uma amostra de telefones. A questão não está dizendo
exatamente quantos, mas ela pegou os vários telefones. E aí, ela encontrou uma relação linear entre a velocidade do processador
e o preço do telefone. Então, este é o preço e esta é a velocidade do processador. Aí ela traçou aqui sua amostra. Para cada telefone,
nós teríamos um ponto de dado. E, então, você vê isto aqui. Ela colocou todos estes pontos
de dados em seu computador e foi capaz de fazer uma linha
de regressão como esta aqui para amostra dela. Para essa linha de regressão da amostra, podemos descrevê-la da seguinte forma, y^ = a + b vezes x. Para amostra, "a" será 127,092. Então, é isto aqui. Já a inclinação da linha de regressão
vai ser o coeficiente de velocidade. Outra maneira de pensar sobre isso é que essa variável "x" é a velocidade, então, o coeficiente é a inclinação. Mas temos que nos lembrar
que essas são estimativas de talvez alguma verdade,
verdadeira, no universo. Se ela pudesse experimentar todos
os telefones do mercado, ela então obteria os verdadeiros
parâmetros populacionais. Só que isto é uma amostra,
é apenas uma estimativa. E só porque ela vê essa relação
linear positiva em sua amostra, não significa necessariamente
que o isto é o caso para toda a população. Então, ela precisa provar que de
fato existe uma relação linear positiva. E é por isso que ela está fazendo
um teste de hipóteses. Em um teste de hipóteses, você assume que não há um relacionamento entre a velocidade
do processador e o preço. Beta (ß), bem aqui, é o verdadeiro parâmetro de população para regressão na população. Então, se esta é a população bem aqui, e se de alguma forma onde
o preço está aqui no eixo vertical e a velocidade do processador
está aqui no eixo horizontal. E, se você pudesse olhar
em toda a população, bem, eu não sei quantos telefones existem, mas pode ser bilhões de telefones. E aí, a gente colocaria tudo
isso aqui. Depois, a gente pode fazer
uma linha de regressão. Então, em nossa hipótese nula, teremos que a inclinação
da linha de regressão será zero. Portanto, a linha de regressão
pode se parecer com algo assim, onde a equação da linha de regressão para a população é esta aqui y^ = α + β vezes x. Em nossa hipótese nula,
β é igual a zero. E a hipótese alternativa
que é suspeita dela é onde temos a verdadeira
inclinação da linha de regressão, sendo realmente maior que zero. Continuando aqui, suponha que todas as condições
para as inferências foram atendidas. Em um nível de significância α = 0,01, há evidências suficientes para concluir
uma relação linear positiva entre estas variáveis para
todos os telefones celulares? Por quê? Então, pause este vídeo e veja
se você consegue responder isto. Bem, para fazer esta tarefa de hipótese temos que pensar o seguinte: assumindo a hipótese nula
como verdadeira, ou seja, supondo que a inclinação real
da linha de regressão populacional é igual a zero, qual é a probabilidade de obtermos
este resultado bem aqui? O que podemos fazer
é usar estas informações e nossa estimativa da
distribuição de amostra da inclinação da linha
de regressão da amostra para chegar a uma estatística "P". E para esta outra situação,
onde a nossa hipótese alternativa diz que a nossa verdadeira inclinação
da linha de regressão populacional é maior do que zero, o nosso valor "p" pode ser visto
como uma probabilidade de encontrar uma estatística "t" maior ou igual a isso. Portanto, obter uma estatística
"t" maior ou igual a 2,999. Agora, você pode estar
tentando dizer: ei, olha, existe esta coluna
que nos dá um valor "p", talvez já tenha sido descoberto que esta probabilidade é 0,004. Bem, temos que tomar
muito cuidado aqui, porque o que está sendo dado aqui é um valor "p" bilateral. Ou seja, se você pensar
em uma distribuição "t" para certos graus de liberdade, poderíamos fazer a seguinte pergunta: qual é a probabilidade
de obter um resultado onde o valor absoluto
é 2,999 ou maior? Bem, se "t" é igual a zero
bem aqui no meio, e isso é 2,999, nós vamos nos preocupar com essa região. Nos preocupamos aqui com
esta cauda direita. E este valor "p" que está aqui não
está apenas nos dando a cauda direita, mas também está dizendo: bem, que tal conseguir algo
menor ou igual a -2,999? Então, isto aqui está nos
dando estas duas áreas. Sendo assim, se você quer
o valor "p" para este cenário, nós apenas olhamos para isso. E como você pode ver, porque
essa distribuição é simétrica, a distribuição "t" vai ser simétrica. E aí, você pega a metade disso. Então, isso vai ser igual a 0,002. E aí, o que você faria em
qualquer teste de significância é comparar seu valor "p"
ao nível de significância. Olhando aqui para este 0,002 e comparando com este 0,01,
qual destes é a maior? Bem, inicialmente, os seus olhos
podem dizer: opa, o 2 é maior do que 1. Mas isto é 2 milésimos
e isto aqui é 1 centésimo. Aqui nós temos 10 milésimos. Portanto, nesta situação, nosso valor "p" é menor que
o nosso nível de significância. E aí, podemos dizer o seguinte: a probabilidade de obter um resultado
neste extremo ou mais extremo é tão baixa se assumirmos
a nossa hipótese nula, que nessa situação nós iremos rejeitá-la. Vamos decidir rejeitar
a nossa hipótese nula e isso sugeriria a alternativa. Sendo assim, existe evidências suficientes para concluir uma relação linear positiva entre estas variáveis para
todos os telefones celulares? Sim. Por quê? Porque o valor "p" é menor do que o nosso
nível de significância. E aí, rejeitamos a nossa hipótese nula. O que sugere a nossa hipótese alternativa. Enfim, meu amigo ou minha amiga, eu espero que você tenha
compreendido tudo direitinho o que conversamos até aqui. E, mais uma vez, eu quero deixar
para você um grande abraço e até a próxima!