Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 5: Como analisar afastamentos da linearidade- Raciocínio para o R²
- R² ou coeficiente de determinação
- Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
- Como interpretar dados de regressão de computador
- Interpretação da regressão de um cálculo de computador
- Impacto da remoção de outliers em retas de regressão
- Pontos influentes na regressão
- Efeitos de pontos influentes
- Identifique pontos influentes
- Como transformar dados não lineares
- Exemplo de regressão linear usando dados transformados
- Faça uma previsão com dados transformados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Como interpretar dados de regressão de computador
Como interpretar dados de regressão gerados por computador para encontrar a equação de uma reta de regressão de mínimos quadrados. Preditores e coeficientes. S e R².
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - Em outros vídeos, fizemos
regressões lineares à mão. No entanto, a maioria das regressões é feita com a ajuda do computador
ou em calculadoras. Neste vídeo, vamos falar sobre o exemplo de um resultado de uma regressão
feita em um computador. Vamos ver como o resultado de uma
regressão, feita em computador, nos dá a equação da linha de regressão e quais outros dados ela nos fornece. Joana está interessada em ver se
estudantes que consomem mais cafeína tendem a estudar mais
e com a qualidade melhor. Ela selecionou 20 estudantes
da escola dela e anotou a ingestão de cafeína deles
em miligramas e o número de horas
que eles gastam para estudar. O ponto de dispersão dos dados
mostrou uma relação linear. Estes são os resultados gerados
em um computador da análise da regressão dos
quadrados mínimos dos dados. Então, nós temos aqui um preditor, os preditores são a constante
e a cafeína em miligramas. Nós temos o coeficiente, entre outras informações. Antes de mais nada,
vamos definir o que é o "y", e o que é o "x" em nossa equação. O "y" vai ser a quantidade
de horas de estudos dos estudantes, ao passo que "x" será
o consumo de cafeína. Então, vamos aqui escrever a fórmula
da reta de regressão linear. Então, nós temos que "y chapéu" vai ser igual a "m" vezes "x", mais "b". Nós já definimos "y" e "x", "b" vai ser o coeficiente da constante. Ou seja, um valor fixo que
não modifica em nossa forma. E o coeficiente da cafeína
será o nosso "m". Veja que o coeficiente da cafeína, multiplica com o consumo de cafeína. Então, vamos relacionar a essa fórmula,
estes valores. Nós temos que o "b" vai ser igual a 2,544 e "m" será igual a 0,164. Substituindo na fórmula, nós temos que y^ = 0,164 vezes "x", mais 2,544. Todos estes outros valores aqui vão ser importantes
para diferente estatísticas. Aqui, nesta situação, não vamos
comentar muito a respeito deles. Porém, em outras oportunidades, poderemos abordar com
mais profundidade estes valores. Aqui embaixo, nós temos
os valores "r" quadrados. Estes valores "r" quadrados são importantes, porque através dele nós identificamos o valor "r". Para identificar o valor "r", basta a gente pegar essa porcentagem e fazer a raiz quadrada dessa porcentagem. "r" vai ser igual a, mais ou menos,
√0,60032. Mas, como nós saberemos
se essa raiz quadrada, se o resultado dessa raiz quadrada será positivo ou negativo? Para a gente identificar isso,
basta a gente olhar para o valor "m". Se o valor "m" for positivo, então, nosso "r" será positivo. Se o valor "m" for negativo,
então, nosso "r" será negativo. Além dos "r" quadrados, nós temos
também os "r" quadrados ajustados. Você só tem que se preocupar
com o "r" quadrado ajustado, se for necessário utilizar
mais de uma variável para explicar a quantidade
de horas de estudos. Aqui, nós não precisamos disso ainda. Utilizamos apenas a cafeína. O último resultado gerado pelo computador, e não menos importante, é a variável "s". A variável "s" consiste no
desvio padrão dos resíduos. O desvio padrão dos resíduos é importante, porque ele mede quão bem a nossa
linha de regressão representa os dados. Ele é, por assim dizer, a medida do erro. Bom, neste vídeo foi possível
você verificar o quanto um computador
ou uma calculadora pode ser útil para calcular uma linha de regressão e nos auxiliar a dar dados importantes para compreender como encontrar
a equação, nessa linha de regressão, bem como outros valore, como "r"
e o desvio padrão dos resíduos.