If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Aproximação quadrática

Aproximações quadráticas estendem a noção de uma linearização local, dando uma aproximação ainda mais precisa de uma função.

O que estamos construindo

O objetivo, como em uma aproximação linear, é aproximar uma função com múltiplas variáveis f, potencialmente complicada, perto de alguma entrada, a qual escreverei como o vetor x0. Uma aproximação quadrática faz isso melhor do que uma aproximação linear, usando as informações fornecidas pelas segundas derivadas parciais.
Forma não vetorial
No caso específico em que a entrada de f é bidimensional e você está aproximando próximo de um ponto (x0,y0), você verá abaixo que a aproximação quadrática acabará tendo esta aparência:
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
Forma vetorial:
De forma geral, para uma função de valor escalar f com qualquer tipo de entrada multidimensional, essa aproximação terá essa aparência:
Qf(x)=f(x0)Constante+f(x0)(xx0)Termo linear+12(xx0)THf(x0)(xx0)Termo quadrático
Eu sei que parece um pouco complicado, mas explicarei passo a passo mais adiante. Aqui está uma breve descrição de cada termo
  • f é uma função com entrada multidimensional e uma saída escalar.
  • f(x0) é o gradiente de f calculado em x0.
  • Hf(x0) é a Matriz Hessiana de f calculada em x0.
  • O vetor x0 é uma entrada específica, aquela perto da qual estamos fazendo a aproximação.
  • O vetor x representa a entrada da variável.
  • A função de aproximação, Qf, tem o mesmo valor que f no ponto x0, todas suas derivadas parciais têm o mesmo valor que as de f nesse ponto, e todas suas derivadas parciais de segunda ordem tem o mesmo valor que as de f nesse ponto.

Aproximações cada vez mais precisas

Suponha que você tenha uma função f(x,y) com duas entradas e um resultado, por exemplo
f(x,y)=sen(x)cos(y)
Invólucro do vídeo da Khan Academy
O objetivo é encontrar uma função mais simples que se aproxime de f(x,y) perto de um ponto (x0,y0) específico. Por exemplo,
(x0,y0)=(π3,π6)

Aproximação de ordem zero

A mais simples das aproximações seria uma função constante que tenha valor igual a f em (x0,y0) em todas as posições possíveis. Chamamos essa aproximação de "aproximação de ordem 0".
No exemplo:
C(x,y)=sen(π3)cos(π6)=(32)32=34
De maneira resumida:
C(x,y)=f(x0,y0)Função constante
De forma gráfica:
O gráfico dessa função aproximada C(x,y) é uma superfície plana que passa através do gráfico de nossa função no ponto (x0,y0;f(x0,y0)). Abaixo você pode assistir a um vídeo que demonstra como essa aproximação varia conforme movemos o ponto (x0,y0).
Invólucro do vídeo da Khan Academy
O gráfico de f é mostrado em azul, o gráfico da aproximação é mostrado em branco, e o ponto (x0,y0;f(x0,y0)) é mostrado como um ponto vermelho.

Aproximação de primeira ordem

A aproximação de ordem zero através de uma função constante não é das melhores. Sim, ela garante se igualar a f(x,y) no ponto (x0,y0), mas só isso. Um passo além seria usar uma aproximação linear, também conhecida como "aproximação de primeira ordem".
No exemplo:
Lf(x,y)=34+34(xπ3)+34(yπ6)
De maneira resumida:
Lf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)
Aqui, fx e fy descrevem as derivadas parciais de f.
De forma gráfica:
O gráfico de uma aproximação linear é o plano tangente ao gráfico de f no ponto (x0,y0;f(x0,y0)). Aqui está um vídeo mostrando como essa aproximação muda conforme movemos o ponto (x0,y0):
Invólucro do vídeo da Khan Academy

Aproximação de segunda ordem

Melhor ainda é uma aproximação quadrática, também conhecida como "aproximação de segunda ordem".
O resto desse artigo é dedicado a encontrar e compreender a forma analítica dessa aproximação, mas antes de entrar em detalhes, vamos ver como essas aproximações são graficamente. Para facilitar a visualização, imagine as aproximações como se estivessem se aninhando entre as curvas do gráfico no ponto (x0,y0;f(x0,y0)), dando-lhe uma espécie de "abraço" matemático.
Invólucro do vídeo da Khan Academy

"Quadrático" significa o produto de duas variáveis

Em funções variáveis simples, a palavra "quadrático" se refere a qualquer situação em que uma variável é elevada ao quadrado, como no termo x2. Com variáveis múltiplas, "quadrático" se refere não apenas a termos elevados ao quadrado, como x2 e y2, mas também a termos que envolvem o produto de duas variáveis separadas, como xy.
Em linhas gerais, a "ordem" de um termo que é o produto de diversos itens, como por exemplo 3x2y3, é o número total de variáveis multiplicadas dentro desse termo. Neste caso, a ordem é 5: Dois x's, três y's, e a constante não conta.

Gráficos de funções quadráticas

Uma forma de estudar uma função quadrática é observar sua concavidade, que pode depender de em que direção você está entrando.
Se a função tem concavidade voltada para cima, como nesse caso, por exemplo, com f(x,y)=x2+y2, o gráfico tomará a seguinte forma:
Essa figura, que é uma parábola tridimensional, se chama paraboloide.
Se a função é côncava para cima em uma direção e linear em outra, o gráfico se parecerá com uma curva parabólica que foi arrastada pelo espaço, formando uma superfície. Como exemplo podemos observar o gráfico de f(x,y)=x2+y:
Por fim, se o gráfico é côncavo para cima em uma direção, mas côncavo para baixo na outra direção, como é o caso de f(x,y)=x2y2, o gráfico fica parecido com uma sela. É assim que um gráfico desses se parece:
Invólucro do vídeo da Khan Academy

Lembrete sobre o passo a passo da aproximação linear

Para que possamos escrever a aproximação quadrática de uma função f próximo ao ponto (x0,y0), temos que começar a partir da aproximação linear:
Lf(x,y)=f(x0,y0)Termo contante+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)Termo linear
Vale a pena ver de novo o passo a passo para encontrar a aproximação linear, já que o passo a passo para encontrar uma aproximação quadrática é bastante similar.
  • Comece com o termo constante f(x0,y0), de forma que nossa aproximação pelo menos coincida com f no ponto (x0,y0).
  • Adicione os termos lineares fx(x0,y0)(xx0) e fy(x0,y0)(yy0).
  • Use as constantes fx(x0,y0) e fy(x0,y0) para garantir que nossa aproximação tenha as mesmas derivadas parciais que f no ponto (x0,y0).
  • Use os termos (xx0) e (yy0) em vez de apenas x e y para que não nos esqueçamos que nossa aproximação é igual a f(x0,y0) no ponto (x0,y0).

Cálculo da aproximação quadrática

Para a aproximação quadrática, somamos os termos quadráticos (xx0)2, (xx0)(yy0), e (yy0)2, e escrevemos, por enquanto, seus coeficientes como as constantes a, b e c, que serão resolvidas em seguida:
Qf(x,y)=f(x0,y0)Parte de ordem 0+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)Parte de ordem 1+a(xx0)2+b(xx0)(yy0)+c(yy0)2Parte quadrática
Da mesma maneira que garantimos que a aproximação linear tivesse as mesmas derivadas parciais de f em (x0,y0), queremos que a aproximação quadrática tenha as mesmas derivadas parciais de segunda ordem que f no mesmo ponto.
O legal de como escrevemos Qf acima é que a derivada parcial de segunda ordem 2Qfx2 depende apenas do termo a(xx0)2.
  • Tente você! Calcule a derivada parcial de segunda ordem em relação a x de qualquer termo na expressão de Qf(x,y) acima e repare que todas vão a zero, com exceção do termo a(xx0)2.
Você tentou mesmo? Estou falando sério, respire por um momento e pense nisso. Vai ajudar bastante a entender por que Qf foi escrita assim.
Isso é legal porque em vez de calcularmos a derivada parcial de segunda ordem de uma expressão monstruosa, podemos ver da seguinte maneira:
2Qfx2(x,y)=(Um monte de 0’s)+2x2a(xx0)2+(mais 0’s)=x2a(xx0)=2a
Uma vez que nosso objetivo é que isto coincida com fxx(x,y) no ponto (x0,y0), podemos resolver a da seguinte forma:
a=12fxx(x0,y0)
Tente você mesmo: use o mesmo raciocínio para resolver as constantes b e c.
Podemos agora escrever nossa aproximação quadrática final, com todos os seus seis termos funcionando em harmonia de forma a imitar o comportamento de f em (x0,y0):
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2

Exemplo: Aproximação de sen(x)cos(y)

Para ver essa fera em ação, vamos experimentá-la na função mencionada na introdução
Problema: encontre a aproximação quadrática de
f(x,y)=sen(x)cos(y)
próximo ao ponto (x,y)=(π3,π6).
Solução:
Para ter todas as informações necessárias, você precisa resolver f(x,y)=sen(x)cos(y), todas as suas derivadas parciais e todas as suas derivadas parciais de segunda ordem no ponto (π3,π6).
f(π3,π6)=

fx(x,y)=
fx(π3,π6)=

fy(x,y)=
fy(π3,π6)=

fxx(x,y)=
fxx(π3,π6)=

fxy(x,y)=
fxy(π3,π6)=

fyy(x,y)=
fyy(π3,π6)=

Quase lá! Como uma etapa final, aplique todos esses valores à fórmula para uma aproximação quadrática.
Assim, por exemplo, para gerar a animação de aproximações quadráticas, essa é a fórmula que tenho que inserir no software de gráficos.
Invólucro do vídeo da Khan Academy

Notação vetorial usando a hessiana

Talvez seja desnecessário dizer que a expressão para a aproximação quadrática é longa. Agora, imagine se f tivesse três entradas, x, y e z. Em teoria, você pode imaginar como isso seria, somar termos que envolvem fz, fxz, fzz, e assim por diante com todas as 3 derivadas parciais e todas as 9 derivadas parciais de segunda ordem. Seria um pesadelo!
Agora, pense em compor um programa para encontrar a aproximação quadrática de uma função que tenha 100 entradas. Loucura!
Mas isso não tem que ser tão difícil assim. Quando uma coisa não é tão complicada na teoria, ela não deve ser assim tão complicada em notação. Aproximações quadráticas são um pouco complicadas, é claro, mas nada que seja um absurdo.
Ao utilizar vetores e matrizes, especificamente o gradiente e a hessiana de f, podemos escrever a aproximação quadrática Qf da seguinte forma:
Qf(x)=f(x0)Constante+f(x0)(xx0)Termo linear+12(xx0)THf(x0)(xx0)Termo quadrático
Vamos decompor o processo em etapas:
  • O x em negrito representa a(s) variável(is) de entrada na forma de um vetor,
    x=[xy]
Além disso, x0 é um vetor específico no espaço de entrada. Se ele tem dois componentes, essa fórmula de Qf é apenas uma maneira alternativa de escrever aquela que derivamos anteriormente, mas que também poderia representar um vetor com qualquer outra dimensão.
  • O produto escalar f(x0)(xx0) vai se expandir como sendo a soma de todos os termos da forma fx(x0)(xx0), fy(x0)(yy0) etc. Se achar que isso não está parecido com a notação vetorial para aproximação linear, tente você mesmo utilizando 2 dimensões para ver com seus próprios olhos!
  • O T sobrescrito na expressão (xx0)T indica "transposta". Isso significa que você pega o vetor inicial (xx0), que parece um pouco com isto:
    (xx0)=[xx0yy0]
E o inverte, para obter algo parecido com isto:
(xx0)T=[xx0yy0]
  • Hf(x0) é a hessiana de f.
  • A expressão (xx0)THf(x0)(xx0) pode parecer complicada se você nunca se deparou com algo assim antes. Na verdade, essa forma de expressar termos quadráticos é muito comum em cálculo vetorial e álgebra vetorial. Logo, vale a pena expandir uma expressão como essa pelo menos algumas vezes na vida. Por exemplo, tente trabalhar no caso em que x é bidimensional para ver como ela fica.
Você deve descobrir que ela é exatamente 2 vezes a porção quadrática da fórmula não vetorial que derivamos acima.

Para quê isso?

Na realidade, é muito cansativo calcular uma aproximação quadrática à mão e é necessário se manter muito organizado para fazê-lo sem cometer nenhum erro. Na prática, as pessoas raramente trabalham na aproximação quadrática como no exemplo acima, mas saber como elas funcionam é útil para pelo menos duas razões gerais:
  • Computação: mesmo que você nunca tenha que escrever uma aproximação quadrática, talvez, um dia, você tenha que programar um computador para fazer isso a fim de resolver uma função específica. Ou, mesmo que você use o programa de outra pessoa, talvez seja necessário analisar como e por que a aproximação está falhando em alguma circunstância.
  • Teoria: ser capaz de entender uma aproximação de segunda ordem nos ajuda a raciocinar sobre o comportamento de funções gerais perto de um ponto. Isso será útil mais tarde para descobrir se um ponto é um máximo ou mínimo local.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.