Conteúdo principal
Curso: Cálculo multivariável > Unidade 3
Lição 6: Otimização com restrições (artigos)Multiplicadores de Lagrange, introdução
A técnica dos "multiplicadores de Lagrange" é uma forma de resolver problemas de otimização com restrições. Super útil!
Conhecimentos prévios
Para onde estamos indo:
- A técnica dos multiplicadores de Lagrange permite que você encontre o máximo ou o mínimo de uma função multivariável
quando há alguma restrição sobre os valores de entrada que podem ser usados. - Essa técnica se aplica apenas a restrições que são mais ou menos assim:Aqui,
é outra função multivariável com o mesmo domínio que , e é uma constante. - A ideia principal é procurar por pontos nos quais as linhas de contorno de
e sejam tangentes entre si.- Isso é o mesmo que encontrar pontos nos quais os vetores gradiente de
e sejam paralelos entre si.
- Isso é o mesmo que encontrar pontos nos quais os vetores gradiente de
- Todo o processo pode ser resumido a igualar o gradiente de uma certa função, chamada de lagrangeana, ao vetor nulo.
Exemplo motivador
Suponha que você queira maximizar essa função:
Suponha também que você esteja se limitando a atribuir apenas valores de entrada que satisfaçam à seguinte equação:
Em outras palavras, para quais pontos no obtemos o maior valor de ?
Estamos nos deparando com o chamado problema de otimização com restrição. O limite aos quais os pontos se submetem é chamado de "restrição" e é a função a ser otimizada.
Uma das maneiras de visualizar isso é: primeiramente, trace o gráfico de , que se parece com um plano inclinado, já que é uma função linear. Em seguida, projete o círculo a partir do plano cartesiano verticalmente no gráfico de . O ponto máximo que buscamos corresponde ao ponto mais alto desse círculo projetado no gráfico.
De forma mais generalizada
Em geral, problemas de otimização com restrição envolvem a maximização ou minimização de uma função multivariável, cuja entrada tem qualquer número de dimensões:
No entanto, sua saída será sempre unidimensional, uma vez que não há uma noção clara de "máximo" com saídas de valores vetoriais.
As restrições nas quais pode ser aplicada a técnica dos multiplicadores de Lagrange devem ter a forma de alguma outra função multivariável sendo igualada a uma constante .
Como isso é para ser uma restrição ao valor de entrada de , o número de dimensões do valor de entrada de é igual ao de . Por exemplo, o exemplo utilizado acima se encaixa nesta forma geral, como demonstrado a seguir:
Utilização de mapas de contorno
Para facilitar o raciocínio, não vamos visualizar com um gráfico, mas com suas linhas de contorno.
É importante lembrar que uma linha de contorno de é o conjunto de todos os pontos nos quais para alguma constante . A ferramenta interativa a seguir mostra como essa linha (em azul) varia conforme a constante varia. O círculo também é mostrado (em vermelho). Tente fazer ter o maior/menor valor possível ao mesmo tempo com que faz com que a linha de contorno de continue interceptando o círculo.
Verificação do conceito: o que significa se, para um valor específico de , a linha azul que representa não interceptar o círculo vermelho que representa ?
Observe que o círculo em que pode ser pensado como uma linha de contorno específica da função . Sabendo disto, a maneira mais inteligente de lidar com problemas de otimização com restrição é:
Observação fundamental: os valores máximo e mínimo de , sujeitos à restrição , correspondem às linhas de contorno de que são tangentes ao contorno que representa .
Se fosse uma outra função, seus contornos poderiam não ser sempre linhas retas. Isso é uma particularidade de nosso exemplo, já que é uma função linear. Por exemplo, veja a seguinte função:
,
Suas linhas de contorno são assim:
Dito isso, a observação fundamental se sustenta, e vale a pena repeti-la: quando é um máximo ou um mínimo de , sujeito à restrição, a linha de contorno para será tangente ao contorno que representa .
Onde o gradiente entra em jogo
Como considerar duas linhas de contorno tangentes em uma fórmula que se possa resolver?
Para responder essa pergunta, voltaremos ao nosso leal amigo, o gradiente. Existem diversas maneiras de interpretar : a direção de inclinação mais íngreme, uma ferramenta para calcular derivadas direcionais etc. Porém, para o nosso objetivo aqui, a propriedade mais importante é que o gradiente de calculado em um ponto sempre resulta em um vetor perpendicular à linha de contorno que passa por esse ponto.
Isso significa que quando as linhas de contorno de duas funções e são tangentes, seus vetores gradientes são paralelos. É assim que isso se parece para funções e arbitrárias:
O fato de as linhas de contorno serem tangentes não nos diz nada sobre a magnitude de cada um desses vetores gradiente, mas tudo bem. Quando dois vetores têm a mesma direção, significa que podemos multiplicar um deles por alguma constante para obter o outro. Especificamente, considere um ponto específico em que as linhas de contorno de e são tangentes (escrever e com um subscrito simplesmente indica que estamos considerando valores constantes, e consequentemente um ponto específico). Como essa tangência significa que seus vetores gradiente estão alinhados, vejamos o que você poderia escrever:
Aqui, representa uma constante. Alguns autores usam uma constante negativa, , mas eu, pessoalmente, prefiro uma constante positiva, já que ela oferece uma interpretação mais clara de na sequência.
Vamos ver como isso fica no nosso exemplo, no qual e . O gradiente de é
e o gradiente de é
Portanto, a condição de tangência termina como:
Resolvendo o problema no caso específico
Para resumir o que fizemos até agora, procuramos pontos de entrada com as seguintes propriedades:
, o que para o nosso exemplo significa para uma constante , o que para nosso exemplo significa
Existem equações e incógnitas, então essa é uma situação perfeitamente solucionável.
A função lagrangeana
Nos anos de 1.700, o nosso amigo Joseph Louis Lagrange estudou problemas de otimização com restrição desse tipo, e encontrou uma maneira inteligente de expressar todas as nossas condições em uma única equação.
Geralmente, você pode escrever estas condições dizendo que estamos procurando pelas constantes , e que satisfaçam às seguintes condições:
- A restrição:
- A condição de tangência:
.Isto pode ser dividido em seus componentes, como segue:
Lagrange escreveu uma nova função especial que assimila todas as mesmas variáveis de entrada como e , juntamente com a novidade , tida agora como uma variável, ao invés de uma constante.
Por exemplo, considere nosso exemplo acima.
Esta nova função ficaria assim:
Observe, a derivada parcial de em relação a é :
Então, podemos traduzir a condição como
Além do mais, veja o que obtemos quando igualamos alguma das outras derivadas parciais a :
Por acaso, essa é outra de nossas condições! De forma quase idêntica, a condição se desenvolve para se tornar
Juntas, estas condições são o mesmo que dizer.
Portanto, as três condições que precisamos resolver para encontrar e se resumem às várias derivadas parciais de serem iguais a . Isto pode ser escrito de maneira extremamente compacta ao igualarmos o gradiente de ao vetor nulo:
Por exemplo, ao usarmos nossas funções específicas indicadas acima, vemos como isso codifica o sistema de equações que precisamos resolver:
Como uma homenagem ao velho Joey Lou, chamamos essa função de a "lagrangeana", e a nova variável que apresentamos é chamada de "multiplicador de Lagrange". Imagine se alguém acrescentasse "-ana" ao fim de seu sobrenome e o tornasse o nome de uma função que todo mundo usa. Muito legal!
Atenção: alguns autores usam uma convenção na qual o sinal de é invertido:
Isto não faz qualquer diferença quando se trata de resolver o problema, mas você deve ter isso em mente caso o curso que você esteja fazendo ou o texto que você esteja lendo siga essa convenção.
Resumo
Se você quiser maximizar (ou minimizar) uma função multivariável sujeita à restrição de que outra função multivariável seja igual a uma constante, , siga as seguintes etapas:
- Etapa 1: introduza uma nova variável
, e defina uma nova função , como a seguir:Essa função é chamada de "lagrangeana", e a nova variável é conhecida como um "multiplicador de Lagrange". - Etapa 2: iguale o gradiente de
ao vetor nulo.Em outras palavras, encontre os pontos críticos de .
- Etapa 3: considere cada solução, que se parecerá mais ou menos com
. Insira cada uma delas em . Ou melhor, primeiro subtraia o componente , e depois a insira em , já que não tem como uma entrada. Qualquer solução que dê o maior (ou menor) valor é o ponto máximo (ou mínimo) que você está procurando.
Quer participar da conversa?
- estou confundir com a regularidade dos pontos que diz nas condições de regularidade podemos considerar lambda0=1
Então quando é que podemos dizer estamos neste condição?Obrigada!(1 voto)