If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Raciocínio por trás do teste da segunda derivada parcial

Para aqueles que querem ver por que a derivada parcial de segunda ordem funciona, eu falo aqui do esboço de uma prova.

Conhecimentos prévios

No último artigo, enunciamos o teste da segunda derivada parcial, mas demos apenas uma prova intuitiva e imprecisa para explicar porque ele é válido. Esse artigo é para aqueles que querem se aprofundar mais na matemática, mas não é realmente necessário se você quiser apenas aplicar o teste da segunda derivada parcial.

O que estamos construindo

  • Para testar se um ponto estacionário de uma função multivariável é um máximo ou mínimo local, examine a aproximação quadrática da função naquele ponto. É mais fácil analisar se essa aproximação quadrática tem um máximo ou mínimo.
  • Para funções de duas variáveis, isso se resume a estudar uma expressão como esta:
    ax2+2bxy+cy2
Essas expressões são conhecidas como formas quadráticas. A regra para uma forma quadrática ser sempre positiva ou sempre negativa se traduz diretamente no teste da segunda derivada parcial.

O caso de uma variável via aproximação quadrática

Primeiramente, eu gostaria de acompanhar o raciocínio formal por trás do motivo pelo qual o teste da segunda derivada de variável única funciona. Por formal, quero dizer capturar a ideia de concavidade em um argumento mais sólido.
No cálculo de uma variável, quando f(a)=0 para alguma função f e algum número a, eis o que o teste da segunda derivada diz:
  • f tem um máximo local em a se f(a)<0
  • f tem um mínimo local em a se f(a)>0
  • Se f(a)=0, a segunda derivada não pode determinar se f tem um ponto de máximo, de mínimo ou de inflexão em a.
Para pensar sobre por que esse teste funciona, comece aproximando a função com um polinômio de Taylor de ordem quadrática, também conhecido como aproximação quadrática.
f(x)f(a)+f(a)(xa)+12f(a)(xa)2
Como f(a)=0, essa aproximação quadrática fica:
f(a)+12f(a)(xa)2
A aproximação quadrática em um mínimo local.
A aproximação quadrática em um mínimo local.
Note que (xa)20 para todos os valores possíveis de x, já que quadrados são sempre positivos ou nulos. Esse simples fato nos diz tudo que precisamos saber! Por que?
Isso significa que quando f(a)>0 podemos entender nossa aproximação como:
f(a)+12f(a)(xa)2Isso é 0 para todos os valores de xe igual a 0 somente quando x=a
Portanto a é um mínimo local da nossa aproximação. Na verdade, ele é um mínimo global, mas estamos preocupados somente com o fato de que ele é um mínimo local. Quando a aproximação quadrática de uma função tem um mínimo local no ponto de aproximação, a própria função deve também ter um mínimo local ali. Falaremos mais sobre isso na última seção, mas por ora a ideia deve ser fácil de entender, já que a função e sua aproximação "se abraçam" uma à outra próximo do ponto de aproximação a.
A aproximação quadrática em um máximo local
A aproximação quadrática em um máximo local
De modo similar, se f(a)<0, podemos entender a aproximação como
f(a)+12f(a)(xa)2Isso é 0 para todos os valores de xe igual a 0 somente quando x=a
Nesse caso, a aproximação tem um máximo local em x=a, indicando que a própria função também tem um máximo local ali.
A aproximação quadrática em um ponto de inflexão é constante.
A aproximação quadrática em um ponto de inflexão é constante.
Quando f(a)=0, nossa aproximação quadrática é sempre igual à constante f(a), o que significa que nossa função é, de certa forma, muito "constante" para ser analisada apenas pela segunda derivada.
O que concluímos a partir disso:
Quando f(a)=0, estudar se f tem um máximo ou mínimo local em a se resume basicamente a estudar se o termo quadrático da aproximação de Taylor 12f(a)(xa)2 é sempre positivo ou sempre negativo.

O caso de duas variáveis - introdução visual

Agora suponha que você tenha uma função f(x,y) com duas entradas e uma saída, e você encontre um ponto estacionário. Ou seja, um ponto onde as derivadas parciais são iguais a 0
fx(x0,y0)=0fy(x0,y0)=0
que é mais sucintamente escrito como
f(x0,y0)=0Vetor zero
Plano tangente
f(x0,y0)=0 indica que o plano tangente em (x0,y0) é horizontal.
Para determinar se esse ponto é um máximo local, mínimo local ou nenhum dos dois, examinamos sua aproximação quadrática. Vamos começar com uma visualização do que queremos fazer:
  • f terá um mínimo local em um ponto estacionário (x0,y0) se a aproximação quadrática nesse ponto for um paraboloide côncavo para cima.
    Mínimo local
  • f terá um máximo local lá se a aproximação quadrática for um paraboloide côncavo para baixo:
    Máximo local
  • Se a aproximação quadrática tiver a forma de uma sela, f não terá nem máximo nem mínimo, mas sim um ponto de sela.
    Ponto de sela
  • Se a aproximação quadrática é plana em uma ou em todas as direções, nós não temos informações o suficiente para tirar conclusões sobre f.
    Aproximação quadrática é plana em uma direção.
    Aproximação quadrática é constante.

Análise da aproximação quadrática

A fórmula da aproximação quadrática de f, na forma vetorial, é a seguinte:
Qf(x)=f(x0)Constante+f(x0)(xx0)Termo linear+12(xx0)THf(x0)(xx0)Termo quadrático
Como estamos interessados em pontos nos quais o gradiente é zero, podemos descartá-lo
Qf(x)=f(x0)+12(xx0)THf(x0)(xx0)
Para ver isto explicado com o máximo de detalhes no caso de duas variáveis, vamos expandir o termo Hessiano,
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
(Note que se essa aproximação ou algo da notação não parece familiar para você, considere rever o artigo sobre aproximações quadráticas).
Como mostramos no caso de uma variável, a estratégia é estudar se o termo quadrático dessa aproximação é sempre positivo ou sempre negativo.
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2}Isso é sempre 0?Isso é sempre 0?Isso pode ser os dois?
Neste momento, esse termo é muito grande para escrevermos, mas podemos extrair sua essência estudando expressões que têm seguinte forma:
ax2+2bxy+cy2
Tais expressões muitas vezes recebem o nome extravagante de "formas quadráticas".
  • A palavra "quadrática" indica que os termos são de ordem dois, o que significa que eles envolvem o produto de duas variáveis.
  • A palavra "forma" sempre me escapou aqui e ela faz a forma quadrática parecer mais complicada do que realmente é. Matemáticos dizem "forma quadrática" em vez de "expressão quadrática" para enfatizar que todos os termos são de ordem 2 e que não existem termos constantes ou lineares arruinando a expressão. Adotar algo como "expressão puramente quadrática" teria sido muito mais razoável e compreensível.
Para tornar a notação de formas quadráticas mais fácil para a generalização em dimensões mais altas, elas são frequentemente escritas em relação a uma matriz simétrica M
xMx=[xy][abbc][xy]
Aqui está a questão crucial:
  • Como podemos saber se a expressão ax2+2bxy+cy2 é sempre positiva, sempre negativa ou nenhuma das duas apenas analisando as constantes a, b e c?

Análise de formas quadráticas

Se fixarmos um valor constante y0 para y, obtemos uma função quadrática de uma variável:
ax2+2bxy0+c(y0)2
O gráfico dessa função é uma parábola que cruza o eixo x somente se a função quadrática tiver raízes reais.
Uma função quadrática com duas raízes reais pode ser tanto positiva quanto negativa.
Uma função quadrática com duas raízes reais pode ser tanto positiva quanto negativa.
Por outro lado, ela é inteiramente positiva ou inteiramente negativa dependendo do sinal de a.
Uma expressão do segundo grau sem raízes reais pode ser totalmente positiva ou totalmente negativa.
Uma expressão do segundo grau sem raízes reais pode ser totalmente positiva ou totalmente negativa.
Podemos aplicar a fórmula de Bhaskara nesta expressão para ver se suas raízes são reais ou complexas.
ax2+2bxy0+c(y0)2
  • O termo principal é a.
  • O termo linear é 2by0.
  • O termo constante é cy02.
Aplicando a fórmula de Bhaskara, temos:
2by0±(2by0)24acy022a2by0±2y0b2ac2ay0(b±b2aca)
Se y0=0, a função quadrática tem uma raiz dupla em x=0, o que significa que a parábola "beija" o eixo x naquele ponto. Por outro lado, o fato de essas raízes serem reais ou não depende apenas do sinal da expressão b2ac.
  • Se b2ac0, existem raízes reais e o gráfico de ax2+2bxy0+c(y0)2 cruza o eixo x.
  • Por outro lado, se b2ac<0, não há nenhuma raiz real e o gráfico de ax2+2bxy0+c(y0)2 fica inteiramente positivo ou inteiramente negativo.
Por exemplo, considere o caso
  • a=1
  • b=3
  • c=5
Neste caso, b2ac=32(1)(5)=4>0 e o gráfico de f(x)=x2+6xy0+5y02 sempre cruza o eixo x. Temos aqui um vídeo mostrando como esse gráfico se movimenta em várias direções quando mudamos lentamente o valor de y0.
Invólucro do vídeo da Khan Academy
Isso corresponde ao fato de que o gráfico de f(x,y)=x2+6xy+5y2 pode tanto ser positivo como negativo.
Invólucro do vídeo da Khan Academy
Por outro lado, considere o caso
  • a=2
  • b=2
  • c=3
Agora, b2ac=22(2)(3)=2<0. Isto significa que o gráfico de f(x)=2x2+4xy0+3y02 nunca cruza o eixo x, embora ele o "beija" se a constante y0 for zero. A seguir, temos um vídeo mostrando como esse gráfico muda quando variamos a constante y0:
Invólucro do vídeo da Khan Academy
Isso corresponde ao fato de a função de várias variáveis f(x,y)=2x2+4xy+3y2 ser sempre positiva.
Invólucro do vídeo da Khan Academy

Regra para o sinal de formas quadráticas

Como se o objetivo fosse confundir estudantes que estão familiarizados com a fórmula de Bhaskara, regras sobre formas quadráticas frequentemente são escritas em função de acb2 em vez de b2ac. Já que uma é o negativo da outra, é necessária uma mudança quando você diz 0 e quando você diz 0. A razão pela qual matemáticos preferem acb2 é porque esse é o determinante da matriz que descreve a forma quadrática.
det([abbc])=acb2
Lembre-se de que é assim que a forma quadrática fica utilizando a matriz.
ax2+2bxy+cy2=[xy][abbc][xy]
Juntando essa convenção com o que encontramos na sessão anterior, escrevemos a regra para o sinal de uma forma quadrática da seguinte forma:
  • Se acb2<0, a forma quadrática pode ter tanto valores positivos quanto negativos, assim como também é possível para ela ser igual a 0 para valores diferentes de (x,y)=(0,0).
  • Se acb2>0 a forma é sempre positiva ou sempre negativa, dependendo do sinal de a, mas em qualquer caso, ela só é igual a 0 em (x;y)=(0;0).
    • Se a>0, a forma é sempre positiva e (0,0) é um ponto de mínimo global da forma.
    • Se a<0, a forma é sempre negativa e (0,0) é um ponto de máximo global da forma.
  • Se acb2=0, novamente a forma ou é sempre positiva ou sempre negativa, mas agora é possível que ela seja igual a 0 em outros valores além de (x,y)=(0,0)

Terminologia:

Quando ax2+2bxy+cy2>0 para todos os (x,y), exceto se (x,y)=(0,0), a forma quadrática e sua matriz associada são ambas chamadas de definidas positivas.
Quando ax2+2bxy+cy2<0 para todos os (x,y), exceto se (x,y)=(0,0), elas são ambas definidas negativas.
Se você trocar o > e < por e , as propriedades correspondentes são semidefinida positiva e semidefinida negativa.

Aplicação disto a Qf

Ok, voltando para onde começamos, vamos escrever nossas aproximações quadráticas novamente:
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
A parte quadrática de Qf é escrita em função de (xx0) e (yy0) em vez de apenas x e y. Portanto, onde quer que a regra para o sinal de formas quadráticas se referir ao ponto (0,0), nós a aplicamos ao ponto (x0;y0)
Como no caso de variáveis únicas, quando a aproximação quadrática Qf tiver um máximo (ou um mínimo) local em (x0;y0), isso quer dizer que f tem um máximo (ou mínimo) local naquele ponto. Isso significa que podemos traduzir diretamente a regra para o sinal de uma forma quadrática para conseguirmos o teste da segunda derivada.
Suponha que f(x0,y0)=0, então,
  • Se fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2<0, f não tem um mínimo nem um máximo em (x0,y0), e sim, um ponto de sela.
    Ponto de sela
  • Se fxx(x0;y0)fyy(x0;y0)(fxy(x0;y0))2>0, f definitivamente tem um máximo ou um mínimo local em (x0;y0), e nós devemos olhar para o sinal de fxx(x0;y0) para descobrirmos qual dos dois.
    • Se fxx(x0,y0)>0, f tem um mínimo local.
      Mínimo local
    • Se fxx(x0,y0)<0, f tem um máximo local.
      Máximo local
  • Se fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2=0, as segundas derivadas por si sós não podem nos dizer se f tem um mínimo ou máximo local.

Nossas ferramentas atuais estão em falta

Tudo o que foi apresentado aqui quase constitui uma prova completa, exceto por uma etapa final.
Intuitivamente, pode fazer sentido que, quando uma aproximação quadrática dobra e se curva de uma certa maneira, a função deva dobrar e se curvar dessa mesma maneira perto do ponto de aproximação. Mas como formalizamos isso além da intuição?
Infelizmente, isso não será feito aqui. Apresentar argumentos sobre derivadas de maneira completamente rigorosa requer o uso de análise real, que é o esqueleto teórico do cálculo.
Além disso, você pode estar se perguntando como isso pode ser generalizado para funções com mais de duas entradas. Temos uma noção de formas quadráticas com múltiplas variáveis, mas para escrever a regra quando tais formas são sempre positivas ou negativas, precisamos usar várias ideias da álgebra linear.

Resumo

  • Para testar se um ponto estacionário de uma função multivariável é um máximo ou mínimo local, examine a aproximação quadrática da função naquele ponto. É mais fácil analisar se essa aproximação quadrática tem um máximo ou mínimo.
  • Para funções de duas variáveis, isso se resume a estudar uma expressão como esta:
    ax2+2bxy+cy2
Essas expressões são conhecidas como formas quadráticas. A regra para uma forma quadrática ser sempre positiva ou sempre negativa se traduz diretamente no teste da segunda derivada parcial.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.