If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Gráficos de resíduos

Como criar e analisar gráficos de resíduos com base em retas de regressão.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Neste vídeo, serão abordados como podemos plotar os resíduos em um gráfico, com base em uma regressão linear. Em vídeos anteriores, nós abordamos como elaborar gráficos em regressão linear, como plotar essa linha com base nestes diferentes pontos. Então, vamos iniciar a plotagem dos resíduos. Antes de mais nada, eu gostaria de revisar contigo o que significa resíduo. Resíduo de um ponto é o local onde um "y", correspondente a um valor "x", se encontra no ponto atual, menos o "y" que era esperado com base na linha de regressão linear. Como nós vimos em outros vídeos, essa reta pode ser representada por "y" igual a 2,50 vezes x - 2. Então, vamos ver o exemplo de cada ponto. Neste primeiro ponto aqui, o "y" correspondente à x = 1, deveria ser 0,5. No entanto, ele está com o valor de 1. Então, substituindo os valores na fórmula nós temos que o "y" esperado é igual a 2,50 vezes "x", que é 1, menos 2. 2,50 - 2 = 0,50. Então, dessa forma, o resíduo para esse ponto aqui vai ser igual a 1, que é o valor "y" atual, menos 0,5 que era o esperado. Com isso, nós temos que o resíduo deste ponto é de +0,5. Este segundo ponto, se localiza em cima do valor que era esperado. Quando x = 2, o esperado era que "y" fosse igual a 3. Então, vamos substituir aqui na fórmula. 2,50 vezes 2, menos 2. Isso vai ser igual a 3. Então, o resíduo deste ponto é igual a zero. Este outro ponto aqui, por sua vez, o valor esperado é de 2,50 vezes 2, menos 2. Então, deveria ser 3, o "y" esperado era 3. Então, o resíduo é igual a 2 - 3, que é igual a -1. Então, nós temos um resíduo de -1. No último ponto, nós temos que 2,50 vezes 3 menos 2, seria igual a 5,5. No entanto, o ponto se encontra em 6. Então, 6 - 5,5 vai ser igual +0,5. Bom, mas como podemos plotar estes valores em uma relação de um eixo "x" e "y"? Vamos observar aqui o eixo "x" e o eixo "y". Perceba que no eixo "x" nós temos os valores 1, 2 e 3. E no eixo "y" nós temos aqui o maior valor negativo que seria -1, - 0,5, + 0,5, + 1. Este primeiro ponto aqui então seria plotado em 1 = 0,5. O segundo ponto o resíduo é nulo, então, o ponto ficará em cima do valor 2 no eixo "x". Isto porque o resíduo foi zero. Para este terceiro ponto, nós vamos colocar aqui x = 2 e y = -1. E o último ponto que será plotado é x = 3 e y = 0,5. A plotagem dos resíduos serve para nos dizer o quanto a linha de regressão é boa para explicar a relação entre duas variáveis. Se é distribuído de forma aleatória, sem observarmos um padrão, então, essa linha é um bom modelo para os dados aqui representados. Agora, se nós observamos uma inclinação ascendente, uma inclinação descendente, uma curva para baixo, ou uma curva para cima, então, nós temos que a linha de regressão não será um bom modelo para os dados plotados. Nesta situação específica é mais adequado fazer o modelo não linear. Bom, mas vamos ver outros exemplos de plotagem dos resíduos. Neste outro exemplo, nós percebemos que para x = 1, o "y" é um pouco superior ao "y" esperado. Então, a bola ficou um pouco para cima. Para x = 2, o "y" ficou um pouco acima do esperado. Para x = 3, o "y" ficou quase 0,5 acima do esperado. Perceba que nestes gráficos os pontos estão distribuídos de forma aleatória e não produzem um padrão. Neste sentido, esta linha de regressão é um bom modelo para explicar este conjunto de dados. Vamos a um terceiro exemplo. Aqui nós percebemos que os dados estão organizados conforme um padrão. Aparentemente, podemos fazer uma curvatura aqui. Neste caso, essa linha não é um bom modelo para a representação deste conjunto de dados. Uma outra forma de observar se a linha de regressão é representativa para um conjunto de dados, é observar o quão distante os pontos estão distribuídos do eixo "x" no gráfico de resíduos. Como podemos ver aqui, os pontos são distantes do eixo "x".