Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Pontos influentes na regressão

Outliers e pontos atípicos podem influenciar em diferentes medidas da regressão de mínimos quadrados, como no coeficiente angular, a interceptação em y e no coeficiente de correlação (r). Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA10C E aí, pessoal! Tudo bem? Nesta aula, vamos falar a respeito de pontos influentes em regressões. Para isso, tenho uma ferramenta aqui que nos permite colocar alguns pontos, como estou fazendo aqui. Deixe-me colocar mais pontos e mais pontos, e posso traçar uma linha de quadrados mínimos... E você pode ver o coeficiente de correlação desta reta, que é de 0.8156 e é bem próximo de 1. Então, esta reta é bem legal de analisar. Mas vamos pensar no que acontece com os pontos que estão fora da reta e como eles podem influenciar nesta reta de regressão. Um desses pontos é bastante conhecido, que é o ponto outlier, e uma maneira de achá-lo é descobrir qual ponto está se distanciando muito da reta. Portanto, se eu colocar um ponto bem aqui, é o outlier porque está fugindo muito do padrão. E o que acontece quando temos esse tipo de ponto? O coeficiente de correlação é igual a 0,8156, mas quando colocamos esse outlier, este coeficiente de correlação vai mudar. Veja que ele reduziu drasticamente este coeficiente, isso porque o outlier está bem longe da reta, está longe do padrão. E este é um ponto que influencia bastante no coeficiente de correlação. Você pode ver que, conforme vou mudando, o coeficiente vai mudando também, não chega a ter um impacto assim tão grande na inclinação da reta. Diminui um pouco, mas não é algo com tanta diferença assim. Veja bem, eu mudo, e a inclinação não muda tanto assim. E mudar este ponto afeta um pouco a interceptação em “y”. Se eu mudar só um pouquinho não afeta tanto, mas se eu trouxer um pouco para a esquerda, aí sim vai afetar. E observe que este outlier está próximo do valor médio de “x”. Agora, para o outlier que está exatamente no ponto médio de “x”, aí, sim, vai influenciar bastante. Olhe, o impacto no valor médio de “x” parece ser maior, e isso, sim, influencia no coeficiente de correlação. Agora, o que acontece se eu colocar o outlier um pouco longe do valor médio de “x”? Quando você escolhe um ponto cujo valor de “x” está mais distante do valor médio, isso é considerado um ponto de alta alavancagem. Para entender isso, pense em uma gangorra que de alguma forma, está sendo articulada no valor médio de “x”. Se você colocar o outlier aqui, meio que a gangorra vai ser puxada para baixo. É como se alguém estivesse sentado no final da gangorra. Inclusive, acho que é daí que vem o termo alavancagem. Se eu colocar um outlier aqui, isso vai fazer muita diferença com a reta. Com toda a certeza, diminui o coeficiente de correlação, com isso muda a inclinação da reta e muda a interceptação em “y”. Portanto, este outlier influencia em tudo! Agora, se eu tiver um ponto de alavancagem que seja um pouco menos atípico, ou seja, que não fuja tanto do padrão, um ponto aqui, por exemplo, com base nos pontos que tenho, não prejudica tanto assim o coeficiente de correlação. Mas note que muda um pouco a interceptação em “y”, e muda um pouquinho também a inclinação. Claro, isso não é tão extremo igual quando você coloca aqui, que acaba mudando muito o coeficiente de correlação. E o que acontece quando você coloca o outlier aqui? Acontece a mesma coisa, você muda bastante o coeficiente de correlação. Então, este outlier de alta alavancagem influencia em tudo, mas, se for mais perto dos pontos padrão, não muda tanto assim. Ainda influencia, ainda muda o coeficiente de correlação, mas não é algo tão extremo assim. É menos influente em termos de inclinação e interceptação “y”. Eu encorajo você a ir a este site e pensar em pontos diferentes e ver o que acontece. Ou seja, a que distância o ponto está em relação ao valor médio de “x”, o quão distante está da reta, o quão distante está do padrão dos pontos, analisar realmente qual ponto é o outlier, e, claro, o quanto eles influenciam em outros aspectos. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!