Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 5: Como analisar afastamentos da linearidade- Raciocínio para o R²
- R² ou coeficiente de determinação
- Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
- Como interpretar dados de regressão de computador
- Interpretação da regressão de um cálculo de computador
- Impacto da remoção de outliers em retas de regressão
- Pontos influentes na regressão
- Efeitos de pontos influentes
- Identifique pontos influentes
- Como transformar dados não lineares
- Exemplo de regressão linear usando dados transformados
- Faça uma previsão com dados transformados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
O desvio-padrão dos resíduos é uma medida do ajustamento de uma reta de regressão aos dados. Ele também é conhecido como raiz do quadrado médio do desvio ou raiz do quadrado médio do erro.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA10C E aí, pessoal?
Tudo bem? Digamos que queremos saber
a relação entre as horas de estudo de uma pessoa e a sua pontuação em um teste. E essa pontuação vai de zero até 6. O que vamos fazer é uma observação
das pessoas que estudaram, ou seja, vamos observar a quantidade
de horas que elas estudaram e sua pontuação. Por exemplo, uma pessoa que estudou
uma hora teve uma pontuação de 1 no teste. E o que vamos fazer com isso
é ajeitar esta linha de regressão. Ou seja, esta é a linha de regressão
real para estes quatro pontos. Aqui está a equação dela,
e existem algumas coisas que você precisa ter em mente
quando faz este tipo de análise. Você geralmente faz isso com muito
mais do que esses quatro pontos, mas a razão pela qual eu os mantive
é porque quero calcular quão boa está a linha de regressão
quando fazemos à mão. E isso porque geralmente
você não traça isso na mão, pois há computadores
que podem fazer isso. A maneira que vamos
medir quão bom é o ajuste desta reta de regressão
aos dados tem vários nomes. Um nome é o desvio-padrão de resíduos, e um outro nome é raiz do quadrado
médio do erro, ou RQME, às vezes também chamado
de erro quadrático médio. Então, o que vamos fazer é calcular
o resíduo para cada um desses pontos, e vamos pegar a soma
de cada um desses resíduos, ou seja, o somatório dos resíduos,
elevar ao quadrado, e dividir isso por n - 2. Em estatística mais avançada, você consegue ver
porque dividimos por n - 2. Mas basicamente o que estamos
tentando fazer é estimar um parâmetro verdadeiro,
o melhor possível, em n - 2. E para calcular a raiz
do quadrado médio do erro devemos tirar a raiz quadrada disso. Claro, você pode até ver
uma semelhança entre isso e como calculamos
a amostra de desvio-padrão no início das nossas aulas de estatística. Eu sugiro que você pense
um pouco a respeito disso. Vamos ver de fato o que acontece. Para isso, vou colocar uma tabela aqui com o valor de “x”,
o valor de “y”, o valor na nossa função,
e também o residual ao quadrado, ou seja, o nosso “y” real
menos o nosso “y” estimado para o valor de x². Então, isso ao quadrado. Depois, vamos somar todos
esses valores, dividir por n - 2 e tirar a raiz quadrada. Vamos começar por este ponto,
que é o ponto 1,1, e vamos substituir na nossa função: 2,5 vezes 1 menos 2, que é igual a 2,5 menos 2,
que é igual a 0,5. E o nosso residual
vai ser igual a “y”, que é 1 menos (0,5)², que vai ser igual a 1 menos 0,5, elevando ao quadrado,
vai ser igual a 0,25. Agora, fazendo para este ponto,
que é o ponto 2,2 vamos ficar com 2,5
vezes 2 menos 2, que vai ser igual a 3. E vamos ficar com 2 menos 3²,
que vai ser igual a 1. Agora, para este ponto,
que é o ponto 2,3, vamos ficar com 2,5
vezes 2 menos 2, que também é igual a 3. Aqui, vamos ficar com 3 menos 3²,
que é igual a zero. Por fim, no 3,6, vamos ficar
com 2,5 vezes 3 menos 2... 2,5 vezes 3 é igual a 7,5, menos 2, é igual a 5,5. Aqui, vamos ficar
com 6 menos (5,5)², que é igual a 0,25. O próximo passo é fazer
o somatório desses valores. Se somarmos tudo isso,
vai ser igual a 1,5. Observe que não precisamos
elevar ao quadrado de novo porque já fizemos isso aqui. E ainda temos que dividir
tudo isso por n - 2. Ou seja, temos: um, dois,
três... quatro dados. Se subtrairmos 2,
vamos ficar com 2. Então, dividimos este 1,5 por 2. Mas, claro, ainda temos que tirar
a raiz quadrada disso tudo, que é a mesma coisa que tirar
a raiz quadrada deste valor. Se você utilizar
uma calculadora, vai ver que isso é
aproximadamente 0,87. Ou seja, este é um bom ajuste
para esta reta de regressão. Quanto mais longe for do zero,
pior vai ser o seu ajuste. E quais seriam as unidades para
a raiz do desvio quadrático médio? Seriam em termos de quaisquer que sejam
as suas unidades para o eixo “y”. Neste caso, seria a pontuação do teste. Espero que esta aula tenha te ajudado. Até a próxima, pessoal!