If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como transformar dados não lineares

Use logaritmos para transformar dados não lineares em uma relação linear para que possamos usar os métodos da regressão dos mínimos quadrados.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA8JV - Olá meu amigo ou minha amiga, tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos conversar sobre uma transformação de dados não lineares. Aqui nós temos alguns dados que podemos traçar em um gráfico de dispersão. Isto aqui vai ficar mais ou menos assim. Agora, eu quero te fazer uma pergunta. Temos conversado muito sobre linhas de regressão, então, como podemos ajustar uma linha de regressão a estes dados aqui? Bem, se tentarmos, podemos obter algo que se parece com isso. Isto aqui é apenas uma observação que eu estou fazendo, mas é claro que você pode inserir estes dados em um computador e tentar desenvolver um modelo de regressão linear para tentar minimizar a soma das distâncias quadradas dos pontos com a linha. Mas, como você pode perceber, isto aqui é muito difícil e, talvez, você esteja até pensando: "isto aqui se parece mais mais com algum tipo de exponencial". Então, talvez a gente possa encaixar uma exponencial para estes dados. Assim, teríamos algo mais ou menos assim. Bem, você não estaria errado em pensar desta forma. Mas existe uma forma que podemos aplicar nossas ferramentas de regressão linear para esse conjunto de dados. A maneira que podemos fazer isso é: em vez de traçar "x" versus "y" podemos pensar em "x" versus o logaritmo de "y". Este aqui é exatamente o mesmo conjunto de dados. Você vê que os valores de "x" são os mesmos, mas para os valores "y", eu apenas te peguei o log de base 10 de todos eles. Então, 10 elevado a uma determinada potência é igual 2.307,23. 10 elevado a 3,36 é igual a 2.307,23. Bem, eu fiz isto aqui com todos esses pontos de dados. Ah, claro, eu fiz isto em uma planilha, tá? É bom deixar isso bem claro. Ao fazer tudo isso, algo legal acontece. De repente, ao plotar "x" versus o log de "y". ou log de "y" versus "x", isso vai você parecer linear. Agora, vamos ser claros, a verdadeira relação entre "x" e "y" não é linear, parece algum tipo de relação exponencial. Mas podemos transformar os dados, e há diferentes formas de fazer isso. Neste caso, fizemos isso pegando log(y). E pensando dessa forma, agora podemos usar nossas ferramentas de regressão linear, porque nesse conjunto de dados poderia realmente caber muito bem uma linha de regressão linear. Você pode imaginar uma linha que se pareça com algo assim, que se encaixaria bem nesses dados. O motivo de você querer fazer isso ao invés de tentar ajustar uma exponencial, é porque a gente já desenvolveu muitas ferramentas em torno da regressão linear, tais como testes de hipóteses em torno da inclinação e intervalos de confiança. Sendo assim, talvez esse seja o melhor caminho a seguir. O legal é que quando você ajusta uma regressão linear, não é difícil, matematicamente falando, sair do modelo linear e levar de volta para o modelo exponencial. Enfim, meu amigo ou minha amiga, a grande lição aqui é que as ferramentas de regressão linear podem ser úteis, mesmo quando o relacionamento subjacente entre "x" e "y'' não é linear. A maneira como fazemos isso é transformando os dados. Aqui, pegamos um logaritmo dos "y", e isso nos ajudou a ver uma relação mais linear entre o log(y) e o "x". Bem, eu espero que tudo isso que a gente conversou te ajude um pouquinho mais a compreender essas ideias, e mais uma vez, eu quero deixar aqui para você um grande abraço, e até a próxima!