Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 5: Como analisar afastamentos da linearidade- Raciocínio para o R²
- R² ou coeficiente de determinação
- Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
- Como interpretar dados de regressão de computador
- Interpretação da regressão de um cálculo de computador
- Impacto da remoção de outliers em retas de regressão
- Pontos influentes na regressão
- Efeitos de pontos influentes
- Identifique pontos influentes
- Como transformar dados não lineares
- Exemplo de regressão linear usando dados transformados
- Faça uma previsão com dados transformados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Pontos influentes na regressão
Outliers e pontos atípicos podem influenciar em diferentes medidas da regressão de mínimos quadrados, como no coeficiente angular, a interceptação em y e no coeficiente de correlação (r). Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA10C E aí, pessoal!
Tudo bem? Nesta aula, vamos falar a respeito de pontos influentes em regressões. Para isso,
tenho uma ferramenta aqui que nos permite colocar alguns pontos,
como estou fazendo aqui. Deixe-me colocar
mais pontos e mais pontos, e posso traçar uma linha
de quadrados mínimos... E você pode ver o coeficiente
de correlação desta reta, que é de 0.8156 e
é bem próximo de 1. Então, esta reta
é bem legal de analisar. Mas vamos pensar no que acontece
com os pontos que estão fora da reta e como eles podem influenciar
nesta reta de regressão. Um desses pontos é bastante conhecido,
que é o ponto outlier, e uma maneira de achá-lo
é descobrir qual ponto está se distanciando muito da reta. Portanto, se eu colocar
um ponto bem aqui, é o outlier porque está fugindo muito do padrão. E o que acontece quando
temos esse tipo de ponto? O coeficiente de correlação
é igual a 0,8156, mas quando colocamos esse outlier,
este coeficiente de correlação vai mudar. Veja que ele reduziu
drasticamente este coeficiente, isso porque o outlier
está bem longe da reta, está longe do padrão. E este é um ponto que influencia
bastante no coeficiente de correlação. Você pode ver que, conforme vou mudando,
o coeficiente vai mudando também, não chega a ter um impacto assim
tão grande na inclinação da reta. Diminui um pouco, mas não é algo
com tanta diferença assim. Veja bem, eu mudo, e a inclinação
não muda tanto assim. E mudar este ponto afeta
um pouco a interceptação em “y”. Se eu mudar só um pouquinho
não afeta tanto, mas se eu trouxer um pouco para a esquerda,
aí sim vai afetar. E observe que este outlier
está próximo do valor médio de “x”. Agora, para o outlier que está
exatamente no ponto médio de “x”, aí, sim, vai influenciar bastante. Olhe, o impacto no valor
médio de “x” parece ser maior, e isso, sim, influencia
no coeficiente de correlação. Agora, o que acontece
se eu colocar o outlier um pouco longe
do valor médio de “x”? Quando você escolhe
um ponto cujo valor de “x” está mais distante do valor médio, isso é considerado um ponto
de alta alavancagem. Para entender isso,
pense em uma gangorra que de alguma forma, está sendo
articulada no valor médio de “x”. Se você colocar o outlier aqui, meio que a gangorra vai ser
puxada para baixo. É como se alguém estivesse
sentado no final da gangorra. Inclusive, acho que é daí
que vem o termo alavancagem. Se eu colocar um outlier aqui, isso vai fazer muita diferença com a reta. Com toda a certeza, diminui
o coeficiente de correlação, com isso muda a inclinação da reta
e muda a interceptação em “y”. Portanto, este outlier influencia em tudo! Agora, se eu tiver um ponto de alavancagem que seja um pouco menos atípico,
ou seja, que não fuja tanto do padrão, um ponto aqui, por exemplo,
com base nos pontos que tenho, não prejudica tanto assim
o coeficiente de correlação. Mas note que muda um pouco
a interceptação em “y”, e muda um pouquinho
também a inclinação. Claro, isso não é tão extremo
igual quando você coloca aqui, que acaba mudando muito
o coeficiente de correlação. E o que acontece quando
você coloca o outlier aqui? Acontece a mesma coisa, você muda
bastante o coeficiente de correlação. Então, este outlier de alta alavancagem
influencia em tudo, mas, se for mais perto dos pontos
padrão, não muda tanto assim. Ainda influencia, ainda muda
o coeficiente de correlação, mas não é algo tão extremo assim. É menos influente
em termos de inclinação e interceptação “y”. Eu encorajo você a ir
a este site e pensar em pontos diferentes
e ver o que acontece. Ou seja, a que distância o ponto está
em relação ao valor médio de “x”, o quão distante está da reta, o quão distante está
do padrão dos pontos, analisar realmente
qual ponto é o outlier, e, claro, o quanto eles
influenciam em outros aspectos. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!