Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Introdução aos resíduos e regressão de mínimos quadrados

Retas de regressão como uma forma de quantificar uma tendência linear. Resíduos em um ponto como a diferença entre o valor real de y em um ponto e o valor estimado de y a partir da reta de regressão, dada a coordenada x do ponto.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA10C E aí, pessoal! Tudo bem? Digamos que queremos descobrir a relação entre idade e altura. Para isso, pegamos um total de dezoito pessoas e perguntamos a sua idade e medimos a sua altura. Cada um destes pontos representa uma pessoa neste gráfico de dispersão. Por exemplo, este ponto está entre 120 e 130, então 125, e 140. Quando olha para este gráfico de dispersão, naturalmente você vê uma certa tendência. Parece que, conforme os meses vão passando, a altura vai aumentando. Claro, existem muitas situações em que pessoas com a mesma idade têm alturas diferentes. Mas o interessante é: será que podemos passar uma reta por estes pontos? A ideia é encaixar o máximo de pontos possíveis nesta reta. Isso é conhecido como regressão linear. Ou seja, o que devemos fazer é tentar encaixar uma reta que minimiza a distância quadrada de cada um desses pontos. Eu vou falar mais disso nos próximos vídeos. Por exemplo, se pegar uma reta assim, você não teria um bom ajuste porque a maioria dos pontos está acima da reta. E, se você pegasse uma reta assim, a maioria dos pontos estaria abaixo dela. Mas, se escolhermos uma reta assim, parece que a reta está seguindo a tendência dos pontos, ou seja, está chegando o mais próximo possível de todos estes pontos. Esta reta é o que chamamos de reta de regressão real. Esta é a reta ŷ, e isso significa que estamos tentando estimar um “y” para um determinado “x”. Ou seja, nem sempre vai ser um “y” real para um determinado “x”. Isso porque às vezes você vê pontos que não estão sobre a reta. Isto vai ser igual a 0,4734x mais 85,012. E você pode ver que, para a maioria destes pontos, dado o valor “x” deles, a estimativa que a nossa reta de regressão dá é diferente do valor real. Essa diferença entre o valor real e a estimativa que a reta dá é conhecida como residual. Então, por exemplo, o residual neste ponto vai ser igual ao “y” real menos o “y” estimado a partir desta linha de regressão para este valor “x”. Então, pause o vídeo e tente descobrir esse resíduo. Vamos lá, então! Você deve pegar este 140, que é o valor real... E qual é o valor “y” estimado para este valor de “x”? Podemos utilizar esta equação. Qual é o valor de “y” quando “x” é igual a 125? Quando pegamos 0,4734, multiplicamos por 125 e somamos isso com 85,012. Você pode utilizar uma calculadora para realizar esse cálculo e vai encontrar 140 menos 144,187. E isso vai ser igual a -4,187. Os residuais podem ser negativos, isso significa que o seu valor real está abaixo da reta de regressão. Mas, se você calcular este residual, este ou este, por exemplo, o valor de “x” estará acima da nossa estimativa, os residuais vão ser positivos. Mais à frente, você vai ver como calculamos essa reta de regressão a fim de minimizar o quadrado desses resíduos. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!