If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Multiplicadores de Lagrange, introdução

A técnica dos "multiplicadores de Lagrange" é uma forma de resolver problemas de otimização com restrições. Super útil!

Para onde estamos indo:

  • A técnica dos multiplicadores de Lagrange permite que você encontre o máximo ou o mínimo de uma função multivariável f(x,y,) quando há alguma restrição sobre os valores de entrada que podem ser usados.
  • Essa técnica se aplica apenas a restrições que são mais ou menos assim:
    g(x,y,)=c
    Aqui, g é outra função multivariável com o mesmo domínio que f, e c é uma constante.
  • A ideia principal é procurar por pontos nos quais as linhas de contorno de f e g sejam tangentes entre si.
    • Isso é o mesmo que encontrar pontos nos quais os vetores gradiente de f e g sejam paralelos entre si.
  • Todo o processo pode ser resumido a igualar o gradiente de uma certa função, chamada de lagrangeana, ao vetor nulo.

Exemplo motivador

Suponha que você queira maximizar essa função:
f(x,y)=2x+y
Gráfico da função f(x,y)=2x+y
Gráfico da função f(x,y)=2x+y
Suponha também que você esteja se limitando a atribuir apenas valores de entrada (x,y) que satisfaçam à seguinte equação:
x2+y2=1
Círculo trigonométrico
Todos os pontos (x,y) satisfazem x2+y2=1, também conhecido como círculo trigonométrico.
Em outras palavras, para quais pontos (x,y) no círculo trigonométrico obtemos o maior valor de 2x+y?
Estamos nos deparando com o chamado problema de otimização com restrição. O limite aos quais os pontos x2+y2=1 se submetem é chamado de "restrição" e f(x,y)=2x+y é a função a ser otimizada.
Uma das maneiras de visualizar isso é: primeiramente, trace o gráfico de f(x,y), que se parece com um plano inclinado, já que f é uma função linear. Em seguida, projete o círculo x2+y2=1 a partir do plano cartesiano verticalmente no gráfico de f. O ponto máximo que buscamos corresponde ao ponto mais alto desse círculo projetado no gráfico.
Invólucro do vídeo da Khan Academy

De forma mais generalizada

Em geral, problemas de otimização com restrição envolvem a maximização ou minimização de uma função multivariável, cuja entrada tem qualquer número de dimensões:
f(x,y,z,)
No entanto, sua saída será sempre unidimensional, uma vez que não há uma noção clara de "máximo" com saídas de valores vetoriais.
As restrições nas quais pode ser aplicada a técnica dos multiplicadores de Lagrange devem ter a forma de alguma outra função multivariável g(x,y,z,) sendo igualada a uma constante c.
g(x,y,z,)=c
Como isso é para ser uma restrição ao valor de entrada de f, o número de dimensões do valor de entrada de g é igual ao de f. Por exemplo, o exemplo utilizado acima se encaixa nesta forma geral, como demonstrado a seguir:
f(x,y)=2x+y
g(x,y)=x2+y2
c=1

Utilização de mapas de contorno

Para facilitar o raciocínio, não vamos visualizar f com um gráfico, mas com suas linhas de contorno.
É importante lembrar que uma linha de contorno de f(x,y) é o conjunto de todos os pontos nos quais f(x,y)=k para alguma constante k. A ferramenta interativa a seguir mostra como essa linha (em azul) varia conforme a constante k varia. O círculo g(x,y)=1 também é mostrado (em vermelho). Tente fazer k ter o maior/menor valor possível ao mesmo tempo com que faz com que a linha de contorno de f continue interceptando o círculo.
Verificação do conceito: o que significa se, para um valor específico de k, a linha azul que representa f(x,y)=k não interceptar o círculo vermelho que representa g(x,y)=1?
Escolha 1 resposta:

Observe que o círculo em que g(x,y)=1 pode ser pensado como uma linha de contorno específica da função g. Sabendo disto, a maneira mais inteligente de lidar com problemas de otimização com restrição é:
Observação fundamental: os valores máximo e mínimo de f, sujeitos à restrição g(x,y)=1, correspondem às linhas de contorno de f que são tangentes ao contorno que representa g(x,y)=1.
Os extremos das restrições são tangentes.
Se f fosse uma outra função, seus contornos poderiam não ser sempre linhas retas. Isso é uma particularidade de nosso exemplo, já que f é uma função linear. Por exemplo, veja a seguinte função:
f(x,y)=2x2+5y,
Suas linhas de contorno são assim:
Dito isso, a observação fundamental se sustenta, e vale a pena repeti-la: quando k é um máximo ou um mínimo de f, sujeito à restrição, a linha de contorno para f(x,y)=k será tangente ao contorno que representa g(x,y)=1.

Onde o gradiente entra em jogo

Como considerar duas linhas de contorno tangentes em uma fórmula que se possa resolver?
Para responder essa pergunta, voltaremos ao nosso leal amigo, o gradiente. Existem diversas maneiras de interpretar f: a direção de inclinação mais íngreme, uma ferramenta para calcular derivadas direcionais etc. Porém, para o nosso objetivo aqui, a propriedade mais importante é que o gradiente de f calculado em um ponto (x0,y0) sempre resulta em um vetor perpendicular à linha de contorno que passa por esse ponto.
Vetores gradiente são perpendiculares às linhas de contorno.
Isso significa que quando as linhas de contorno de duas funções f e g são tangentes, seus vetores gradientes são paralelos. É assim que isso se parece para funções f e g arbitrárias:
Imagem da Wikipédia de linhas de contorno tangentes
O fato de as linhas de contorno serem tangentes não nos diz nada sobre a magnitude de cada um desses vetores gradiente, mas tudo bem. Quando dois vetores têm a mesma direção, significa que podemos multiplicar um deles por alguma constante para obter o outro. Especificamente, considere (x0,y0) um ponto específico em que as linhas de contorno de f e g são tangentes (escrever x0 e y0 com um 0 subscrito simplesmente indica que estamos considerando valores constantes, e consequentemente um ponto específico). Como essa tangência significa que seus vetores gradiente estão alinhados, vejamos o que você poderia escrever:
f(x0,y0)=λ0g(x0,y0)
Aqui, λ0 representa uma constante. Alguns autores usam uma constante negativa, λ0, mas eu, pessoalmente, prefiro uma constante positiva, já que ela oferece uma interpretação mais clara de λ0 na sequência.
Vamos ver como isso fica no nosso exemplo, no qual f(x,y)=2x+y e g(x,y)=x2+y2. O gradiente de f é
f(x,y)=[x(2x+y)y(2x+y)]=[21]
e o gradiente de g é
g(x,y)=[x(x2+y21)y(x2+y21)]=[2x2y]
Portanto, a condição de tangência termina como:
[21]=λ0[2x02y0]

Resolvendo o problema no caso específico

Para resumir o que fizemos até agora, procuramos pontos de entrada (x0,y0) com as seguintes propriedades:
  • g(x0,y0)=1, o que para o nosso exemplo significa
    x02+y02=1
  • f(x0,y0)=λ0g(x0,y0) para uma constante λ0, o que para nosso exemplo significa
    2=2λ0x01=2λ0y0
Existem 3 equações e 3 incógnitas, então essa é uma situação perfeitamente solucionável.

A função lagrangeana

Retrato de Lagrange
Joseph Louis Lagrange, parecendo tranquilo, satisfeito e sonolento, tudo ao mesmo tempo. Wikimedia Commons
Nos anos de 1.700, o nosso amigo Joseph Louis Lagrange estudou problemas de otimização com restrição desse tipo, e encontrou uma maneira inteligente de expressar todas as nossas condições em uma única equação.
Geralmente, você pode escrever estas condições dizendo que estamos procurando pelas constantes x0, y0 e λ0 que satisfaçam às seguintes condições:
  • A restrição:
    g(x0,y0)=c
  • A condição de tangência:
    f(x0,y0)=λ0g(x0,y0).
    Isto pode ser dividido em seus componentes, como segue:
  • fx(x0,y0)=λ0gx(x0,y0)
  • fy(x0,y0)=λ0gy(x0,y0)
Lagrange escreveu uma nova função especial que assimila todas as mesmas variáveis de entrada como f e g, juntamente com a novidade λ, tida agora como uma variável, ao invés de uma constante.
L(x,y,λ)=f(x,y)λ(g(x,y)c)
Por exemplo, considere nosso exemplo acima.
f(x,y)=2x+yg(x,y)=x2+y2c=1
Esta nova função ficaria assim:
L(x,y,λ)=2x+yλ(x2+y21).
Observe, a derivada parcial de L em relação a λ é (g(x,y)c):
Lλ(x,y,λ)=λ(f(x,y)λ(g(x,y)c)=0(g(x,y)c)
Então, podemos traduzir a condição g(x,y)=c como
Lλ(x,y,λ)=g(x,y)+c=0
Além do mais, veja o que obtemos quando igualamos alguma das outras derivadas parciais a 0:
Lx(x,y,λ)=0x(f(x,y)λ(g(x,y)c))=0fx(x,y)λgx(x,y)=0fx(x,y)=λgx(x,y)
Por acaso, essa é outra de nossas condições! De forma quase idêntica, a condição Ly(x,y,λ)=0 se desenvolve para se tornar
fy(x,y)=λgy(x,y)
Juntas, estas condições são o mesmo que dizer.
f(x,y)=λg(x,y)
Portanto, as três condições que precisamos resolver para encontrar x,y e λ se resumem às várias derivadas parciais de L serem iguais a 0. Isto pode ser escrito de maneira extremamente compacta ao igualarmos o gradiente de L ao vetor nulo:
L=0
Por exemplo, ao usarmos nossas funções específicas indicadas acima, vemos como isso codifica o sistema de equações que precisamos resolver:
L=[x(2x+yλ(x2+y21))y(2x+yλ(x2+y21))λ(2x+yλ(x2+y21))]=[22λx12λyx2y2+1]=[000]
Como uma homenagem ao velho Joey Lou, chamamos essa função L de a "lagrangeana", e a nova variável λ que apresentamos é chamada de "multiplicador de Lagrange". Imagine se alguém acrescentasse "-ana" ao fim de seu sobrenome e o tornasse o nome de uma função que todo mundo usa. Muito legal!
Atenção: alguns autores usam uma convenção na qual o sinal de λ é invertido:
L(x,y,λ)=f(x,y)+λ(g(x,y)c)
Isto não faz qualquer diferença quando se trata de resolver o problema, mas você deve ter isso em mente caso o curso que você esteja fazendo ou o texto que você esteja lendo siga essa convenção.

Resumo

Otimização com restrição
Créditos de imagem: Por Nexcis (Trabalho próprio) [Domínio público], via Wikimedia Commons
Se você quiser maximizar (ou minimizar) uma função multivariável f(x,y,) sujeita à restrição de que outra função multivariável seja igual a uma constante, g(x,y,)=c , siga as seguintes etapas:
  • Etapa 1: introduza uma nova variável λ, e defina uma nova função L, como a seguir:
    L(x,y,,λ)=f(x,y,)λ(g(x,y,)c)
    Essa função L é chamada de "lagrangeana", e a nova variável λ é conhecida como um "multiplicador de Lagrange".
  • Etapa 2: iguale o gradiente de L ao vetor nulo.
    L(x,y,,λ)=0Vetor nulo
    Em outras palavras, encontre os pontos críticos de L.
  • Etapa 3: considere cada solução, que se parecerá mais ou menos com (x0,y0,,λ0). Insira cada uma delas em f. Ou melhor, primeiro subtraia o componente λ0, e depois a insira em f, já que f não tem λ como uma entrada. Qualquer solução que dê o maior (ou menor) valor é o ponto máximo (ou mínimo) que você está procurando.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.