Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Desvio-padrão de resíduos ou raiz do quadrado médio do erro (RQME)

Cálculo do desvio-padrão de resíduos (ou raiz do quadrado médio do erro (RQME) ou raiz do quadrado médio do desvio (RQMD)) para medir a divergência entre o modelo de regressão linear e um conjunto de dados.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - O que vamos fazer, neste vídeo, é calcular uma medida típica de quão bem os pontos de dados reais se encaixam de acordo com o modelo. Neste caso, o modelo linear. E há vários nomes para isso. Podemos considerar que é o desvio padrão dos resíduos. É isso, essencialmente, que nós iremos calcular. Mas também podemos chamá-lo de erro quadrático médio. E você verá por que chamamos dessa forma. Porque, basicamente, isso descreve como calculá-lo. Então, o que vamos fazer é olhar para os resíduos de cada um destes pontos e vamos encontrar o desvio padrão deles. Então, eu vou dar uma pequena revisão. O resíduo vai ser igual a um "y", para um dado "x", menos o valor previsto. um "y chapéu" para um dado "x". Nós já fizemos isso em outro vídeo, então eu só estou revendo. Então, agora, vamos calcular os resíduos. Vamos começar por este aqui. O resíduo vai ser, então, o valor real, então, o valor de "y" é 1, menos o valor esperado pelo modelo. O modelo previa 2,5 vezes o valor de "x", que é 1, então seria 2,5 menos 2, que daria 0,5. Então, 1 menos 0,5 é igual a 0,5. Vamos calcular este agora. O resíduo seria o valor real, que é 6, menos o valor esperado pelo modelo. Seria este ponto aqui. Então, seria 3 vezes 2,5, que é 7,5, menos 2, que nos daria 5,5. 6 - 5,5 = 0,5. Vamos calcular para este valor agora. Este valor aqui, está se encaixando perfeitamente no modelo. Então, o valor real dele é 3. E o modelo previa um valor igual a 3, isso nos dá um resíduo igual a zero. Agora, vamos fazer este. O resíduo é igual ao valor real, seria 2, menos o valor esperado. 2 vezes 2,5 é 5, menos 2, igual a 3. 2 - 3 = -1. Agora, repare nisso. Este valor e este valor, são valores positivos e eles estão acima da linha. Já este valor aqui é um valor negativo e ele está abaixo da linha. Este valor é um valor zero, porque ele está exatamente em cima da linha do modelo. Então, se verificarmos essa distância aqui, ela realmente corresponde a 0,5. Porque é do 6 até o 5,5. E aqui também, do 1 até o 0,5, e do 2 até o 3. Então, agora nós podemos calcular o desvio padrão dos resíduos. Então, nós vamos elevar os resíduos ao quadrado. Então, este primeiro aqui. 0,5² e vamos somar mais o segundo resíduo. -1² + 0² + 0,5². Então, pegamos os resíduos, elevamos ao quadrado, e somamos todos eles. E quando você toma um desvio padrão típico, você está tomando a distância entre um ponto e a média. E aqui nós estamos considerando a distância entre um ponto e o que era previsto pelo modelo, mas estamos elevando cada um desses resíduos ao quadrado e somando todos eles. E assim como fazemos com o desvio padrão da amostra, agora, dividir por 1, menos o número de resíduos que acabamos de escrever aqui. Seria 1 menos 4, que daria 3. Você poderia ver essa parte como a média quadrática dos erros. Agora, vamos extrair a raiz quadrada disso. Vamos extrair da raiz quadrada disso. 0,5² é 0,25, mais, -1² é 1, 0² é zero. Não vou nem colocar aqui. E 0,5², de novo, é 0,25. E tudo isso dividido por 3. Então, este aqui seria igual a, 0,25 + 1 + 0,25 = 1,5, sobre 3. 1,5 é a metade de 3. Então, isso aqui é a mesma coisa que √1/2. Vamos utilizar a calculadora para tirar essa raiz quadrada. 1/2 é a mesma coisa que 0,5, vamos tirar a raiz quadrada. 0,707. Então, isso aqui é aproximadamente 0,707. Se você quisesse visualizar um desvio padrão dos resíduos abaixo da linha, seria algo parecido com isso. Um desvio padrão acima da linha, seria algo parecido com isso. Isto é, obviamente, apenas uma aproximação desenhada à mão, mas você pode ver a grosso modo, como se pareceria, mais ou menos, um resíduo típico. Agora, é importante notar que algumas pessoas vão dizer que é a média de resíduo. E tudo depende, então, de como você pensa sobre a palavra média. Porque estes são os quadrados dos resíduos. E quando pensamos em dados anômalos que estão muito distantes dessa linha, e quando elevamos isso ao quadrado, isso causará um impacto desproporcional aqui. E se você não quer este tipo de impacto, o que pode ser feito é encontrar a média dos resíduos absolutos que, na verdade, de certa forma teria sido a forma mais simples de fazer isso. Mas essa é uma maneira padrão de se descobrir quando um modelo não concorda com os dados reais. Então, você pode imaginar que quanto menor for este número, melhor é o ajuste ao modelo.