Conteúdo principal
Estatística Avançada
Introdução aos resíduos e regressão de mínimos quadrados
Retas de regressão como uma forma de quantificar uma tendência linear. Resíduos em um ponto como a diferença entre o valor real de y em um ponto e o valor estimado de y a partir da reta de regressão, dada a coordenada x do ponto.
Quer participar da conversa?
- Como ele chegou no primeiro valor de y ?
y=0,4734x + 85,012
Como ele chegou nesse número ?(3 votos) - Bom dia nao consegui responder as questoes(1 voto)
Transcrição de vídeo
RKA10C E aí, pessoal!
Tudo bem? Digamos que queremos descobrir a relação entre idade e altura. Para isso, pegamos um total
de dezoito pessoas e perguntamos a sua idade
e medimos a sua altura. Cada um destes pontos representa
uma pessoa neste gráfico de dispersão. Por exemplo, este ponto
está entre 120 e 130, então 125,
e 140. Quando olha para
este gráfico de dispersão, naturalmente você
vê uma certa tendência. Parece que, conforme os meses
vão passando, a altura vai aumentando. Claro, existem muitas situações
em que pessoas com a mesma idade têm alturas diferentes. Mas o interessante é: será que podemos
passar uma reta por estes pontos? A ideia é encaixar o máximo
de pontos possíveis nesta reta. Isso é conhecido
como regressão linear. Ou seja, o que devemos fazer
é tentar encaixar uma reta que minimiza a distância quadrada
de cada um desses pontos. Eu vou falar mais disso
nos próximos vídeos. Por exemplo, se pegar uma reta assim,
você não teria um bom ajuste porque a maioria dos pontos
está acima da reta. E, se você pegasse uma reta assim, a maioria dos pontos estaria abaixo dela. Mas, se escolhermos uma reta assim, parece que a reta está
seguindo a tendência dos pontos, ou seja, está chegando o mais próximo
possível de todos estes pontos. Esta reta é o que chamamos
de reta de regressão real. Esta é a reta ŷ, e isso significa que estamos tentando
estimar um “y” para um determinado “x”. Ou seja, nem sempre vai ser um “y” real
para um determinado “x”. Isso porque às vezes você vê pontos
que não estão sobre a reta. Isto vai ser igual a 0,4734x mais 85,012. E você pode ver que,
para a maioria destes pontos, dado o valor “x” deles, a estimativa que
a nossa reta de regressão dá é diferente do valor real. Essa diferença entre o valor real
e a estimativa que a reta dá é conhecida como residual. Então, por exemplo,
o residual neste ponto vai ser igual ao “y” real
menos o “y” estimado a partir desta linha de regressão
para este valor “x”. Então, pause o vídeo
e tente descobrir esse resíduo. Vamos lá, então! Você deve pegar este 140,
que é o valor real... E qual é o valor “y” estimado
para este valor de “x”? Podemos utilizar esta equação. Qual é o valor de “y”
quando “x” é igual a 125? Quando pegamos 0,4734, multiplicamos por 125
e somamos isso com 85,012. Você pode utilizar uma calculadora
para realizar esse cálculo e vai encontrar 140 menos 144,187. E isso vai ser igual a -4,187. Os residuais podem ser negativos,
isso significa que o seu valor real está abaixo da reta de regressão. Mas, se você calcular este residual,
este ou este, por exemplo, o valor de “x” estará acima
da nossa estimativa, os residuais vão ser positivos. Mais à frente, você vai ver como
calculamos essa reta de regressão a fim de minimizar
o quadrado desses resíduos. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!