Conteúdo principal
Álgebra linear
Curso: Álgebra linear > Unidade 3
Lição 2: Projeções ortogonais- Projeções em subespaços
- Visualização de uma projeção em um plano
- Uma projeção em um subespaço é uma transformação linear
- Exemplo de matriz de projeção de subespaço
- Outro exemplo de matriz de projeção
- Projeção é o vetor mais próximo no subespaço
- Aproximação de mínimos quadrados
- Exemplos de mínimos quadrados
- Outro exemplo de mínimos quadrados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Outro exemplo de mínimos quadrados
Usando a aproximação de mínimos quadrados para ajustar uma linha aos pontos. Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA4JL - Eu tenho aqui quatro pontos marcados
com suas coordenadas do sistema cartesiano, um deles é o -1, zero,
em amarelo. -1, zero aqui. O outro deles
é o zero, 1, em azul. zero, 1,
aqui em azul. O outro é 1, 2,
em verde. O outro é o 2, 1, em vermelho,
que você vê aqui. 2 para x, 1 para y.
Está aqui. Meu objetivo com este vídeo
é achar a equação de uma reta y igual a mx mais b
que passe por esses pontos. Bem, mas é evidente que
se eu procurar, por exemplo, uma reta que passa por estes
dois pontos, não vai passar pelos outros. Se eu encontrar uma que passe por esses dois,
talvez eu consiga passar por mais um, mas não vai passar pelo outro,
e assim por diante. Então a ideia é usar o método
dos mínimos quadrados para achar a reta que passa
o mais próximo possível de todos eles. Se houvesse uma equação
que satisfizesse todos os pontos, de uma reta que passasse
por todos os pontos, isso significaria pegar a equação da reta,
aplicar cada ponto aqui a ela e conseguir uma solução única.
Isso quer dizer o seguinte. Por exemplo, no primeiro ponto que nós temos
aqui, -1, zero, anotado em amarelo, ali, se x é igual a -1,
então y é igual a zero. Isso nos leva a, ao escrever
a equação da reta, ter zero igual a m vezes -1,
fica -1m, mais b. y igual a mx mais b usando
-1 para x e zero para y. No segundo ponto, que eu estou destacando
em azul, x é zero, e y é igual a 1, e isso na equação da reta nos leva a quê?
Colocando 1 no lugar do y, 1 igual, e colocando zero no lugar do x,
isso tudo fica zero, então não temos esse pedaço e
teríamos zero m mais b. No terceiro ponto, que eu vou colocar ali
em verde, x é igual a 1, y é igual a 2. Trocando na equação da reta
temos y, que é 2, igual a mx. x é 1, vezes m, m,
mais b. Vamos agora para o ponto que
eu marquei em vermelho, esse aqui, em que x é igual a 2
e y é igual a 1. Temos na equação da reta,
então, y, que é 1, igual a mx, então m vezes 2, 2m,
mais b. Se nós tivéssemos, então,
uma solução única para uma equação da reta
que passa por todos esses pontos, significaria resolver
este sistema de equações e achar m e b para a equação
desta reta que passa por todos eles. Mas nós já sabemos geometricamente
que isso é impossível, e aqui também o sistema, como está
composto aqui, também é impossível. Este sistema não tem solução.
Sem solução. O que nós vamos
fazer, então, é usar o método dos mínimos
quadrados para procurar uma solução, por esse método, para uma reta
que passa o mais próximo possível, de acordo com esse critério,
com esse método, por todos os pontos,
perto de todos os pontos. Primeiro vamos reescrever, então,
esse sistema usando a notação matricial, com a equação, uma matriz A multiplicando
um vetor x igual a um certo vetor b. A matriz A é a matriz dos coeficientes
das incógnitas, nesse caso m e b. Vamos escrevê-la
aqui, então. A matriz A, quatro linhas porque
temos quatro equações, e duas colunas porque
só temos duas incógnitas. Usando os coeficientes
das incógnitas, então, temos na primeira linha
-1 para m, 1 para b, na segunda linha,
zero para m, 1 para b, na terceira linha,
1 para m, 1 para b, e finalmente, na quarta linha,
2 para m, 1 para b. Essa é a matriz A. Esta matriz, multiplicando o vetor x,
é o vetor das incógnitas, então aqui temos
m e b. Isso tem que ser igual ao vetor
composto pelos termos independentes, pelos valores aqui que não envolvem
as letras m e b, que são zero, 1, 2, 1. Mantenha sempre em mente,
então, que A é esta matriz, x é este vetor,
b é este vetor. Neste caso, este sistema composto por
esta equação matricial não tem solução, e nós vamos, então, procurar a solução
com o método dos mínimos quadrados. E o que significa procurar a solução
usando o método dos mínimos quadrados? Significa tomar esta equação inicial e multiplicar
os dois lados pela transposta da matriz A. Nós teríamos, então,
"A transposta" multiplicando A, multiplicando x, que vai
ser o vetor procurado, e por isso vamos
chamar de x estrela, e isso é igual a “A transposta”
multiplicando o vetor b. Veja que x se chama, agora, x estrela
porque ele contém a solução aproximada para aquele sistema pelo
método dos mínimos quadrados. Vamos obter "A transposta" multiplicada por A,
"A transposta" multiplicada pelo vetor b, montar um novo sistema
com x estrela e resolvê-lo. A matriz A é essa
que você vê aqui. "A transposta" é só trocar as linhas
pelas colunas e vice-versa. A primeira coluna aqui vai
virar a primeira linha e tal. Então a matriz "A transposta"
vai ser [-1, 0, 1, 2], a primeira coluna
virou a primeira linha, e a segunda coluna,
a segunda linha, [1, 1, 1, 1]. Ela multiplica
a matriz A, eu quero saber o que é que dá
essa multiplicação. A matriz A, eu simplesmente
copiei dali de cima. Vamos efetuar a multiplicação,
que está bem fácil. Eu tomo cada termo da primeira linha
multiplicando por cada termo da primeira coluna, -1 por -1, zero por zero, e assim
por diante, e somo todos os resultados. Depois eu faço a mesma coisa, da primeira
linha para a segunda coluna, e da segunda linha
para as duas colunas também. Vamos lá, -1 vez -1 dá 1,
zero vez zero dá zero, 1 vez 1 dá 1
e 2 vezes 2 dá 4. Somando tudo isso
nós vamos ter 6. Agora a primeira linha
de novo com a segunda coluna. Todos vão ser multiplicados por 1,
-1 vez 1, zero vez 1, então fica bem fácil. É só somar
todos esses. -1 mais zero mais 1 mais 2
vai resultar em 2, então aqui eu tenho 2. Agora vamos para
a segunda linha, primeira coluna. 1 multiplica cada um desses,
que permanecem os mesmos. É só somar tudo
e nós vamos ter novamente 2. E, finalmente, 1 multiplica 1, 1 multiplica 1,
aqui com a segunda linha, segunda coluna, é só somar todos esses 1
e nós vamos ter 4. Isso que nós temos aqui é o resultado
de "A transposta" multiplicada por A. Vamos, agora, entender o que é
"A transposta" multiplicada por b. Lembre-se: nosso objetivo é obter x estrela, mas
primeiro precisamos arrumar as outras partes. "A transposta" multiplicada por b,
vamos lá. Eu preparei aqui, então. Esta aqui é "A transposta", igual
ao que já tínhamos aqui acima, e este aqui é o vetor b, que é exatamente
o que nós já tínhamos aqui. Vamos efetuar a multiplicação, então.
No resultado, duas linhas e uma coluna, porque o número de linhas
é determinado pela primeira matriz, e o número de colunas é
determinado pela segunda matriz. Temos que multiplicar
cada termo da primeira linha pelo termo da primeira
coluna aqui e somar todos. Então -1 vez zero é zero,
zero vez 1 é zero, 1 vez 2 é 2,
2 vezes 1 é 2. Somando temos, então, 4.
Depois, 1 vez zero é zero. Bom, aqui são todos multiplicados
por 1, basta somá-los. 1 mais 2 mais 1,
nós temos também 4 aqui. Então isso que eu acabo de escrever
é a "A transposta" multiplicando o vetor b. Vamos, então, voltar ao sistema que
nos dá a solução por mínimos quadrados. Quero dizer, reescrever isso tudo aqui
usando o que nós obtivemos aqui e aqui. "A transposta" A é o que
você vê aqui, [6, 2, 2, 4], multiplica x estrela, que é aquilo
que procuramos conhecer. Isso tem que ser igual a
"A transposta" b, que é essa aqui. O vetor x estrela
tem as componentes, em vez de m e b, que nós tínhamos aqui,
eu vou chamar de m estrela, b estrela. E aqui eu escrevo novamente
a equação matricial, só que agora aqui me dá a resposta,
ou melhor, a solução, por mínimos quadrados. Vamos resolver esse sistema. Vamos
efetuar a multiplicação dessas duas matrizes. 6, lembre-se, 6 vezes m estrela
mais 2 vezes b estrela. Isso tem que ser igual ao primeiro
elemento que temos aqui, que é 4. E agora a mesma coisa
na segunda linha. 2 vezes m estrela mais 4 vezes b estrela tem que ser
igual ao segundo elemento, que é o segundo 4 que temos aqui.
Compõem o sistema bem simples 2 por 2. Você tem vários caminhos
para resolver esse sistema. Eu vou, por exemplo, multiplicar
a primeira equação por -2 e adicionar, na segunda equação,
pensando em "sumir", entre aspas, com b, porque 2b vezes -2, vamos ter -4b estrela
que, adicionando, vai ser cancelado. Então 6m estrela vezes -2,
-12m estrela, com mais 2,
então -10m estrela. Mais 2b estrela vezes -2, -4b estrela.
Somando 4b estrela, zero, e 4 vezes -2 dá -8,
com mais 4, -4. Aqui fica fácil, então,
para achar m estrela. m estrela vai ser igual a, dividindo
os dois lados por -10, ficamos com 4/10. Naturalmente podemos simplificar
dividindo por 2, então m estrela é ⅖. Para obter b estrela
agora está bem fácil. Eu posso substituir o ⅖ no lugar
do m estrela em qualquer equação e calcular b estrela ou fazer
esse procedimento de novo. Esqueça tudo o que está em laranja,
e vamos agora observar. A partir da segunda equação, se eu multiplicá-la
por -3 e adicionar a primeira equação (veja estou esquecendo o que estava
em laranja e fazendo tudo de novo). 2m estrela multiplicado por -3
fica -6m estrela aqui, que vai cancelar aqui,
m estrela. 4b estrela multiplica por -3
fica -12b estrela, com mais 2b estrela,
temos -10b estrela. E finalmente, 4 vezes -3 é -12,
-12 com mais 4 nos dá -8. Basta dividir por -10 e nós
teríamos que b estrela é 8/10. Simplificando por 2 temos ⅘ para b estrela.
Assim descobrimos m estrela e b estrela. Agora eu posso, então, determinar que o vetor
x estrela, que era quem nós procurávamos, que é a solução deste sistema por mínimos
quadrados, é ⅖ para m e ⅘ para b. Lembre-se: na verdade, o que nós estávamos
querendo achar era a equação de uma reta em que m é ⅖, m estrela
neste caso, e b estrela é ⅘. Quer dizer que a equação daquela reta
que passa o mais próximo possível, de acordo com esse método,
daqueles pontos dados, é a equação
y igual a ⅖x mais ⅘. Esta é a solução que minimiza a distância
entre A multiplicando x estrela e o vetor b. Essa é a solução que nos dá
a menor distância entre esses dois, por isso, interpretando
para o caso da reta, é a reta que passa mais próxima
de todos os pontos que nós queríamos. Em outras palavras,
não há outra solução que nos dá um resultado
mais próximo para o vetor b do que essa
que encontramos. Vamos agora, então, representar
a reta encontrada graficamente para poder analisar um pouco mais próximo aos pontos
com os quais nós estávamos trabalhando. A equação da reta está aqui,
y igual a ⅖x mais ⅘. Localizando no gráfico, vamos começar
localizando o termo independente. ⅘ é onde a reta
cruza o eixo y. ⅘ é 0,8, então se aqui for a metade,
ele está mais pra cima da metade. Aqui seria ⅘, a reta tem
que passar por este ponto e o fato de x estar
multiplicado por ⅖ quer dizer que a cada unidade que eu avanço no x,
y avança ⅖ de uma unidade. Para facilitar, eu vou avançar
duas unidades no x, que é 2, de maneira que y avance, então, ⅘.
⅖ vezes 2, ele avança ⅘ para cima. Então do 0,8 ele vai para 1,6 aqui.
A metade seria algo próximo disso, então teríamos um ponto
provavelmente aqui. E a reta que passa
por esses dois pontos é a reta que nós estávamos
procurando aqui. Infinita, naturalmente. A reta que nos dá
a melhor solução, de maneira a minimizar a distância
entre ela e os pontos trabalhados, é esta reta que você
vê aqui em laranja. Aí está uma aplicação do método
dos mínimos quadrados. Espero que você tenha
achado bastante útil. Isso tem muitas outras aplicações,
não só na álgebra linear. Até o próximo vídeo!