Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 5: Como analisar afastamentos da linearidade- Raciocínio para o R²
- R² ou coeficiente de determinação
- Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
- Como interpretar dados de regressão de computador
- Interpretação da regressão de um cálculo de computador
- Impacto da remoção de outliers em retas de regressão
- Pontos influentes na regressão
- Efeitos de pontos influentes
- Identifique pontos influentes
- Como transformar dados não lineares
- Exemplo de regressão linear usando dados transformados
- Faça uma previsão com dados transformados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Como transformar dados não lineares
Use logaritmos para transformar dados não lineares em uma relação linear para que possamos usar os métodos da regressão dos mínimos quadrados.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA8JV - Olá meu amigo ou minha amiga,
tudo bem com você? Seja muito bem-vindo ou bem-vinda
a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos conversar sobre uma transformação de dados não lineares. Aqui nós temos alguns dados que podemos traçar em um gráfico de dispersão. Isto aqui vai ficar mais ou menos assim. Agora, eu quero te fazer uma pergunta. Temos conversado muito
sobre linhas de regressão, então, como podemos ajustar uma linha de regressão a estes dados aqui? Bem, se tentarmos, podemos obter algo que se parece com isso. Isto aqui é apenas uma observação
que eu estou fazendo, mas é claro que você pode inserir estes dados em um computador e tentar desenvolver um modelo de regressão linear para tentar minimizar a soma das distâncias quadradas dos pontos com a linha. Mas, como você pode perceber, isto aqui é muito difícil e, talvez,
você esteja até pensando: "isto aqui se parece mais mais
com algum tipo de exponencial". Então, talvez a gente possa encaixar uma exponencial para estes dados. Assim, teríamos algo mais ou menos assim. Bem, você não estaria errado
em pensar desta forma. Mas existe uma forma que podemos aplicar nossas ferramentas de regressão linear para esse conjunto de dados. A maneira que podemos fazer isso é: em vez de traçar "x" versus "y" podemos pensar em "x"
versus o logaritmo de "y". Este aqui é exatamente o
mesmo conjunto de dados. Você vê que os valores de "x" são os mesmos, mas para os valores "y", eu apenas te peguei o log de base 10 de todos eles. Então, 10 elevado a uma determinada
potência é igual 2.307,23. 10 elevado a 3,36 é igual a 2.307,23. Bem, eu fiz isto aqui com todos esses pontos de dados. Ah, claro, eu fiz isto em uma planilha, tá? É bom deixar isso bem claro. Ao fazer tudo isso, algo legal acontece. De repente, ao plotar "x"
versus o log de "y". ou log de "y" versus "x",
isso vai você parecer linear. Agora, vamos ser claros, a verdadeira relação entre "x" e "y"
não é linear, parece algum tipo de relação exponencial. Mas podemos transformar os dados, e há diferentes formas de fazer isso. Neste caso, fizemos isso pegando log(y). E pensando dessa forma, agora podemos usar nossas ferramentas de regressão linear, porque nesse conjunto de dados poderia realmente caber muito bem
uma linha de regressão linear. Você pode imaginar uma linha que se pareça com algo assim, que se encaixaria bem nesses dados. O motivo de você querer fazer isso ao invés de tentar ajustar uma exponencial, é porque a gente já desenvolveu muitas ferramentas em torno da regressão linear, tais como testes de hipóteses em torno da inclinação e intervalos de confiança. Sendo assim, talvez esse seja o melhor caminho a seguir. O legal é que quando você ajusta uma regressão linear, não é difícil, matematicamente falando, sair do modelo linear e levar de volta
para o modelo exponencial. Enfim, meu amigo ou minha amiga, a grande lição aqui é que as ferramentas de regressão linear podem ser úteis, mesmo quando o relacionamento subjacente entre "x" e "y'' não é linear. A maneira como fazemos isso
é transformando os dados. Aqui, pegamos um logaritmo dos "y", e isso nos ajudou a ver uma relação mais linear entre o log(y) e o "x". Bem, eu espero que tudo isso
que a gente conversou te ajude um pouquinho mais
a compreender essas ideias, e mais uma vez, eu quero deixar aqui
para você um grande abraço, e até a próxima!