If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Ajuste de uma reta aos dados

Neste vídeo, criamos um diagrama de dispersão e depois traçamos uma reta de acordo com os dados sobre a renda familiar mediana na Califórnia. Versão original criada por Sal Khan.

Transcrição de vídeo

RKA - Nesse vídeo, gostaria de mostrar um exemplo do que significa colocar dados numa reta. Em vez de apresentar um vídeo tradicional usando minha prancheta digital, vou fazer diretamente no Excel, para que aprendam a fazer sozinhos com o Excel, ou outro tipo de programa de planilhas. Nós não vamos nos aprofundar na matemática disso, o que eu quero é que entenda conceitualmente o que significa ajustar dados em uma reta, ou fazer uma regressão linear. Vamos ler o problema. A tabela abaixo mostra a renda média da Califórnia. Lembre-se de que mediana é a renda média da Califórnia de 1995 a 2002, conforme relatório do U.S. Census Bureau. Elabore um gráfico de dispersão e descubra a equação. Na sua opinião, qual seria a renda média de uma família californiana no ano de 2010? Quais são os significados do coeficiente angular e da interceptação com o eixo "y" desse problema? A primeira coisa que deve fazer... apenas copiei e colei essa imagem para colocar os dados num formato compreensível para a planilha... vamos fazer algumas tabelas. Digamos anos desde 1995... vamos fazer uma coluna só... vou alargar um pouco. A seguir, vou colocar a renda média. Essa é a renda média na Califórnia para uma família. Começamos com um ano zero a partir de 1995... 0, 1, 2, 3, 4... na verdade, se quiser, ele vai descobrir a tendência caso continue a descer; ele perceberá que está aumentando em "1". A seguir, a renda. Vou simplesmente copiar esses números. Assim, esse é 53.807; 55.217; 55.209; 55.415; 63.100; 63.206; 63.761; e, por último, 65.766 dólares. Não preciso desses aqui, então, vou me livrar deles; posso apagar. Deixa eu ver se eu tenho entradas suficientes. Aqui, tenho um, dois, três, quatro, cinco, seis, sete, oito; e, aqui, um, dois, três, quatro, cinco, seis, sete, oito entradas. Quero me assegurar de que os dados estão corretos: 53.807; 55.207; 55.209; 415; 100; 206; 761; 766. Agora, você vai ver que é incrivelmente fácil de fazer no Excel se souber onde clicar. Primeiro, indique os dados, crie um gráfico de dispersão, e depois e ainda melhor, crie uma regressão desses dados. Assim, tudo o que tem que fazer é selecionar os dados. A seguir, vá para "inserir" (e é legal inserir um gráfico de dispersão). Aqui, dá para selecionar os diferentes tipos de gráficos de dispersão. Só quero indicar os dados. Pronto, ele indicou os dados para mim e pronto. Essa linha vertical é a renda efetiva, e essa linha horizontal é o ano desde 1995. Esse ponto é 1995, ela foi 53.807. Em 96, 55.217. Nos deram todos os dados. Agora, quero criar uma reta (essa não é exatamente uma reta). Bom, vamos ver que, se pressupor que uma reta pode modelar bem esses dados, vou começar com que o Excel insira uma reta para mim. O que posso fazer é escolher uma reta entre todas essas opções diferentes para inserir retas. Vou escolher essa. Talvez não esteja vendo, mas ela pode... ela parece ter uma reta entre pontos, e também tem "f(x)" que medirá a equação da reta. Vou clicar nela e pronto. Ela não apenas inseriu os dados, mas marcou novamente os mesmos dados em um gráfico diferente... (vou aumentar um pouco... não, não quero fazer isso.... vou aumentar um pouco mais)... a gente pode pintar os dados agora porque acho que já sabemos o que estamos fazendo. Vou cobrir assim. Ele não apenas marcou os vários pontos de dados, na verdade, ajustou a reta aos dados e me deu a equação dessa reta. (Vou tentar aumentar um pouco; vou tirar daqui, para conseguir ao menos ler). Ela me diz logo que a equação para esta reta é "y = 1.882,3‧(x) + 52.847", Se se lembrar do que aprendemos sobre coeficiente angular e interceptação de "y", a interceptação de "y" é 52.847, que é... se usar essa reta como medida, onde essa reta intercepta no ano zero, ou em 1995... assim, se usar essa reta como modelo... em 1995, ela diria que você iria ter uma renda de 52.847. O dado real era um pouco diferente desse, ele era um pouco mais alto, "53.807" (ele era um pouco mais alto). Mas o que estamos tentando obter é uma reta que se aproxime o melhor possível de todos esses dados. Estamos tentando, na verdade, minimizar a distância, o quadrado da distância entre cada um desses pontos na reta. Não vamos fazer cálculos, mas tem essa bela equação. Agora, a gente pode usar para fazer previsões. Se disser que esse é um bom modelo para os dados... vou abaixar um pouco... vamos tentar responder à pergunta. Criamos um gráfico de dispersão (na verdade, o Excel criou para nós), descobrimos a equação, e eles perguntam: na sua opinião, qual seria a renda média anual de uma família californiana no ano de 2010? Aqui, simplesmente, dá para usar a equação que ele nos deu. Esse ponto era 2002; poderia escrever o ano, esse foi o ano de 2002. Portanto, o ano de 2010 são 8 anos a mais. Vou criar uma coluna; esse é o ano de 1995, [19]96... e o Excel vai conseguir descobrir o que eu quero se eu selecionar esses embaixo e rolar para baixo. E o Excel vai perceber que quero incrementar em 1 ano a cada vez. Se eu disse anos desde 1995, mais uma vez, apenas continua essa tendência aqui. Assim, 2010 seria o ano 15. Vamos, então, aplicar essa equação. A gente poderia dizer que ela será igual a... de acordo com esta reta, vou apenas inserir e espero que consigam ler o que estou dizendo. "1.882,3‧(x)". "x", aqui, é o ano a partir de 1995. Eu poderia, simplesmente, selecionar essa célula ou inserir o número 15. Isso significa vezes essa célula (vezes 15). A seguir, mais 52.847... mais isto aqui, e clico em "enter", e ele prevê US$81.081,50. Assim, se puxar essa reta por outros 8 anos, ele prevê que a renda média de uma família californiana será de: 81 mil dólares. De qualquer modo, espero que tenha achado interessante. Planilhas são ferramentas muito úteis para manipular dados, porque elas mostram o porquê modelos lineares e retas são interessantes. Além disso, mostra como pode usar essas ferramentas para interpretar dados e, até mesmo, extrapolar algum tipo de previsão. Esta é uma extrapolação usando a regressão linear.