If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Outro exemplo de mínimos quadrados

Usando a aproximação de mínimos quadrados para ajustar uma linha aos pontos. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA4JL - Eu tenho aqui quatro pontos marcados com suas coordenadas do sistema cartesiano, um deles é o -1, zero, em amarelo. -1, zero aqui. O outro deles é o zero, 1, em azul. zero, 1, aqui em azul. O outro é 1, 2, em verde. O outro é o 2, 1, em vermelho, que você vê aqui. 2 para x, 1 para y. Está aqui. Meu objetivo com este vídeo é achar a equação de uma reta y igual a mx mais b que passe por esses pontos. Bem, mas é evidente que se eu procurar, por exemplo, uma reta que passa por estes dois pontos, não vai passar pelos outros. Se eu encontrar uma que passe por esses dois, talvez eu consiga passar por mais um, mas não vai passar pelo outro, e assim por diante. Então a ideia é usar o método dos mínimos quadrados para achar a reta que passa o mais próximo possível de todos eles. Se houvesse uma equação que satisfizesse todos os pontos, de uma reta que passasse por todos os pontos, isso significaria pegar a equação da reta, aplicar cada ponto aqui a ela e conseguir uma solução única. Isso quer dizer o seguinte. Por exemplo, no primeiro ponto que nós temos aqui, -1, zero, anotado em amarelo, ali, se x é igual a -1, então y é igual a zero. Isso nos leva a, ao escrever a equação da reta, ter zero igual a m vezes -1, fica -1m, mais b. y igual a mx mais b usando -1 para x e zero para y. No segundo ponto, que eu estou destacando em azul, x é zero, e y é igual a 1, e isso na equação da reta nos leva a quê? Colocando 1 no lugar do y, 1 igual, e colocando zero no lugar do x, isso tudo fica zero, então não temos esse pedaço e teríamos zero m mais b. No terceiro ponto, que eu vou colocar ali em verde, x é igual a 1, y é igual a 2. Trocando na equação da reta temos y, que é 2, igual a mx. x é 1, vezes m, m, mais b. Vamos agora para o ponto que eu marquei em vermelho, esse aqui, em que x é igual a 2 e y é igual a 1. Temos na equação da reta, então, y, que é 1, igual a mx, então m vezes 2, 2m, mais b. Se nós tivéssemos, então, uma solução única para uma equação da reta que passa por todos esses pontos, significaria resolver este sistema de equações e achar m e b para a equação desta reta que passa por todos eles. Mas nós já sabemos geometricamente que isso é impossível, e aqui também o sistema, como está composto aqui, também é impossível. Este sistema não tem solução. Sem solução. O que nós vamos fazer, então, é usar o método dos mínimos quadrados para procurar uma solução, por esse método, para uma reta que passa o mais próximo possível, de acordo com esse critério, com esse método, por todos os pontos, perto de todos os pontos. Primeiro vamos reescrever, então, esse sistema usando a notação matricial, com a equação, uma matriz A multiplicando um vetor x igual a um certo vetor b. A matriz A é a matriz dos coeficientes das incógnitas, nesse caso m e b. Vamos escrevê-la aqui, então. A matriz A, quatro linhas porque temos quatro equações, e duas colunas porque só temos duas incógnitas. Usando os coeficientes das incógnitas, então, temos na primeira linha -1 para m, 1 para b, na segunda linha, zero para m, 1 para b, na terceira linha, 1 para m, 1 para b, e finalmente, na quarta linha, 2 para m, 1 para b. Essa é a matriz A. Esta matriz, multiplicando o vetor x, é o vetor das incógnitas, então aqui temos m e b. Isso tem que ser igual ao vetor composto pelos termos independentes, pelos valores aqui que não envolvem as letras m e b, que são zero, 1, 2, 1. Mantenha sempre em mente, então, que A é esta matriz, x é este vetor, b é este vetor. Neste caso, este sistema composto por esta equação matricial não tem solução, e nós vamos, então, procurar a solução com o método dos mínimos quadrados. E o que significa procurar a solução usando o método dos mínimos quadrados? Significa tomar esta equação inicial e multiplicar os dois lados pela transposta da matriz A. Nós teríamos, então, "A transposta" multiplicando A, multiplicando x, que vai ser o vetor procurado, e por isso vamos chamar de x estrela, e isso é igual a “A transposta” multiplicando o vetor b. Veja que x se chama, agora, x estrela porque ele contém a solução aproximada para aquele sistema pelo método dos mínimos quadrados. Vamos obter "A transposta" multiplicada por A, "A transposta" multiplicada pelo vetor b, montar um novo sistema com x estrela e resolvê-lo. A matriz A é essa que você vê aqui. "A transposta" é só trocar as linhas pelas colunas e vice-versa. A primeira coluna aqui vai virar a primeira linha e tal. Então a matriz "A transposta" vai ser [-1, 0, 1, 2], a primeira coluna virou a primeira linha, e a segunda coluna, a segunda linha, [1, 1, 1, 1]. Ela multiplica a matriz A, eu quero saber o que é que dá essa multiplicação. A matriz A, eu simplesmente copiei dali de cima. Vamos efetuar a multiplicação, que está bem fácil. Eu tomo cada termo da primeira linha multiplicando por cada termo da primeira coluna, -1 por -1, zero por zero, e assim por diante, e somo todos os resultados. Depois eu faço a mesma coisa, da primeira linha para a segunda coluna, e da segunda linha para as duas colunas também. Vamos lá, -1 vez -1 dá 1, zero vez zero dá zero, 1 vez 1 dá 1 e 2 vezes 2 dá 4. Somando tudo isso nós vamos ter 6. Agora a primeira linha de novo com a segunda coluna. Todos vão ser multiplicados por 1, -1 vez 1, zero vez 1, então fica bem fácil. É só somar todos esses. -1 mais zero mais 1 mais 2 vai resultar em 2, então aqui eu tenho 2. Agora vamos para a segunda linha, primeira coluna. 1 multiplica cada um desses, que permanecem os mesmos. É só somar tudo e nós vamos ter novamente 2. E, finalmente, 1 multiplica 1, 1 multiplica 1, aqui com a segunda linha, segunda coluna, é só somar todos esses 1 e nós vamos ter 4. Isso que nós temos aqui é o resultado de "A transposta" multiplicada por A. Vamos, agora, entender o que é "A transposta" multiplicada por b. Lembre-se: nosso objetivo é obter x estrela, mas primeiro precisamos arrumar as outras partes. "A transposta" multiplicada por b, vamos lá. Eu preparei aqui, então. Esta aqui é "A transposta", igual ao que já tínhamos aqui acima, e este aqui é o vetor b, que é exatamente o que nós já tínhamos aqui. Vamos efetuar a multiplicação, então. No resultado, duas linhas e uma coluna, porque o número de linhas é determinado pela primeira matriz, e o número de colunas é determinado pela segunda matriz. Temos que multiplicar cada termo da primeira linha pelo termo da primeira coluna aqui e somar todos. Então -1 vez zero é zero, zero vez 1 é zero, 1 vez 2 é 2, 2 vezes 1 é 2. Somando temos, então, 4. Depois, 1 vez zero é zero. Bom, aqui são todos multiplicados por 1, basta somá-los. 1 mais 2 mais 1, nós temos também 4 aqui. Então isso que eu acabo de escrever é a "A transposta" multiplicando o vetor b. Vamos, então, voltar ao sistema que nos dá a solução por mínimos quadrados. Quero dizer, reescrever isso tudo aqui usando o que nós obtivemos aqui e aqui. "A transposta" A é o que você vê aqui, [6, 2, 2, 4], multiplica x estrela, que é aquilo que procuramos conhecer. Isso tem que ser igual a "A transposta" b, que é essa aqui. O vetor x estrela tem as componentes, em vez de m e b, que nós tínhamos aqui, eu vou chamar de m estrela, b estrela. E aqui eu escrevo novamente a equação matricial, só que agora aqui me dá a resposta, ou melhor, a solução, por mínimos quadrados. Vamos resolver esse sistema. Vamos efetuar a multiplicação dessas duas matrizes. 6, lembre-se, 6 vezes m estrela mais 2 vezes b estrela. Isso tem que ser igual ao primeiro elemento que temos aqui, que é 4. E agora a mesma coisa na segunda linha. 2 vezes m estrela mais 4 vezes b estrela tem que ser igual ao segundo elemento, que é o segundo 4 que temos aqui. Compõem o sistema bem simples 2 por 2. Você tem vários caminhos para resolver esse sistema. Eu vou, por exemplo, multiplicar a primeira equação por -2 e adicionar, na segunda equação, pensando em "sumir", entre aspas, com b, porque 2b vezes -2, vamos ter -4b estrela que, adicionando, vai ser cancelado. Então 6m estrela vezes -2, -12m estrela, com mais 2, então -10m estrela. Mais 2b estrela vezes -2, -4b estrela. Somando 4b estrela, zero, e 4 vezes -2 dá -8, com mais 4, -4. Aqui fica fácil, então, para achar m estrela. m estrela vai ser igual a, dividindo os dois lados por -10, ficamos com 4/10. Naturalmente podemos simplificar dividindo por 2, então m estrela é ⅖. Para obter b estrela agora está bem fácil. Eu posso substituir o ⅖ no lugar do m estrela em qualquer equação e calcular b estrela ou fazer esse procedimento de novo. Esqueça tudo o que está em laranja, e vamos agora observar. A partir da segunda equação, se eu multiplicá-la por -3 e adicionar a primeira equação (veja estou esquecendo o que estava em laranja e fazendo tudo de novo). 2m estrela multiplicado por -3 fica -6m estrela aqui, que vai cancelar aqui, m estrela. 4b estrela multiplica por -3 fica -12b estrela, com mais 2b estrela, temos -10b estrela. E finalmente, 4 vezes -3 é -12, -12 com mais 4 nos dá -8. Basta dividir por -10 e nós teríamos que b estrela é 8/10. Simplificando por 2 temos ⅘ para b estrela. Assim descobrimos m estrela e b estrela. Agora eu posso, então, determinar que o vetor x estrela, que era quem nós procurávamos, que é a solução deste sistema por mínimos quadrados, é ⅖ para m e ⅘ para b. Lembre-se: na verdade, o que nós estávamos querendo achar era a equação de uma reta em que m é ⅖, m estrela neste caso, e b estrela é ⅘. Quer dizer que a equação daquela reta que passa o mais próximo possível, de acordo com esse método, daqueles pontos dados, é a equação y igual a ⅖x mais ⅘. Esta é a solução que minimiza a distância entre A multiplicando x estrela e o vetor b. Essa é a solução que nos dá a menor distância entre esses dois, por isso, interpretando para o caso da reta, é a reta que passa mais próxima de todos os pontos que nós queríamos. Em outras palavras, não há outra solução que nos dá um resultado mais próximo para o vetor b do que essa que encontramos. Vamos agora, então, representar a reta encontrada graficamente para poder analisar um pouco mais próximo aos pontos com os quais nós estávamos trabalhando. A equação da reta está aqui, y igual a ⅖x mais ⅘. Localizando no gráfico, vamos começar localizando o termo independente. ⅘ é onde a reta cruza o eixo y. ⅘ é 0,8, então se aqui for a metade, ele está mais pra cima da metade. Aqui seria ⅘, a reta tem que passar por este ponto e o fato de x estar multiplicado por ⅖ quer dizer que a cada unidade que eu avanço no x, y avança ⅖ de uma unidade. Para facilitar, eu vou avançar duas unidades no x, que é 2, de maneira que y avance, então, ⅘. ⅖ vezes 2, ele avança ⅘ para cima. Então do 0,8 ele vai para 1,6 aqui. A metade seria algo próximo disso, então teríamos um ponto provavelmente aqui. E a reta que passa por esses dois pontos é a reta que nós estávamos procurando aqui. Infinita, naturalmente. A reta que nos dá a melhor solução, de maneira a minimizar a distância entre ela e os pontos trabalhados, é esta reta que você vê aqui em laranja. Aí está uma aplicação do método dos mínimos quadrados. Espero que você tenha achado bastante útil. Isso tem muitas outras aplicações, não só na álgebra linear. Até o próximo vídeo!