If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Raciocínio para o R²

Quando inicialmente aprendemos sobre o coeficiente de correlação, r, nós nos concentramos no que ele significava, em vez de como calculá-lo, uma vez que os cálculos são grandes e, normalmente, os computadores resolvem isso para a gente.
Faremos o mesmo com o r2 e nos concentraremos na interpretação de seu significado.
De certa forma, o r2 mede quanto do erro de previsão é eliminado quando usamos a regressão de mínimos quadrados.

Previsão sem regressão

Usamos a regressão linear para prever y dado algum valor de x. Mas suponha que tivéssemos que prever um valor de y sem um valor de x correspondente.
Se não usarmos a regressão sobre a variável x, nossa estimativa mais razoável vai simplesmente prever a média dos valores de y.
Este é um exemplo no qual a reta de previsão é simplesmente a média dos dados de y:
Observe que esta reta não parece se ajustar muito bem aos dados. Uma maneira de medir o ajuste da reta é calcular a soma dos quadrados dos resíduos - isso nos dará uma ideia geral do valor do erro de previsão de um determinado modelo.
Portanto, sem a regressão de mínimos quadrados, nossa soma dos quadrados será 41,1879
O uso da regressão de mínimos quadrados diminuiria o valor do erro de previsão? Se sim, em quanto? Vamos ver!

Previsão com regressão

Estes são os mesmos dados com a reta de regressão de mínimos quadrados correspondente e as estatísticas resumidas:
Equaçãorr2
y^=0,5x+1,50,8160,6659
Esta reta parece se ajustar muito bem aos dados, mas para medir o quanto melhor ela se ajusta, podemos olhar novamente a soma dos quadrados dos resíduos:
O uso da regressão de mínimos quadrados reduziu a soma dos quadrados dos resíduos de 41,1879 para 13,7627.
Portanto, o uso da regressão de mínimos quadrados eliminou uma quantia considerável do erro de previsão. Mas quanto?

O R² mede quanto do erro de previsão é eliminado

Sem usar a regressão, nosso modelo tinha uma soma total de quadrados de 41,1879. O uso da regressão de mínimos quadrados reduziu isso para 13,7627.
Assim, o total reduzido foi de 41,187913,7627=27,4252.
Podemos representar esta redução como um percentual do montante original do erro de previsão:
41,187913,762741,1879=27,425241,187966,59%
Se você olhar acima novamente, verá que r2=0,6659.
O R² nos informa que percentual é eliminado do erro de previsão na variável y quando usamos a regressão de mínimos quadrados sobre a variável x.
Como resultado, r2 também é chamado de coeficiente de determinação.
Muitas definições formais dizem que o r2 informa que percentual da variabilidade na variável y é considerado na regressão sobre a variável x.
Parece bem estranho que apenas elevar r ao quadrado resulte nesta medida. Provar esta relação entre r e r2 é bastante complexo e está além dos objetivos de um curso introdutório de estatística.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.