If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

O gradiente

O gradiente armazena todas as informações da derivada parcial de uma função multivariável. Porém, ele é mais do que um simples dispositivo de armazenamento: ele tem diversas interpretações maravilhosas e muitos usos.

Com o que você deve estar familiarizado antes de começar essa lição:

O que estamos construindo

  • O gradiente de uma função multivariável de valores escalares f(x,y,), denotado f, contém todas as informações sobre suas derivadas parciais em um vetor:
    f=[fxfy]
    Em particular, isso significa que f é uma função vetorial.
  • Imagine você parado no ponto (x0,y0,) no domínio de f, o vetor f(x0,y0,) diz a você em que direção você deve caminhar para aumentar o valor de f mais rapidamente.
  • Esses vetores gradientes — f(x0;y0;) — também são perpendiculares às linhas de contorno de f.

Definição

Depois de aprender que funções com uma entrada multidimensional têm derivadas parciais, você pode se perguntar qual é a derivada total de uma função desse tipo. No caso de funções multivariáveis com valor escalar, ou seja, funções com entrada multidimensional mas com resultado unidimensional, a resposta é o gradiente.
O gradiente de uma função f, denotado por f, é a coleção de todas as suas derivadas parciais em um vetor.
É mais fácil entender isso com um exemplo.

Exemplo 1: duas dimensões

Se f(x;y)=x2xy, qual das opções a seguir representa f?
Escolha 1 resposta:

Perceba que f é uma função de valor vetorial, especificamente uma com uma entrada bidimensional e um resultado bidimensional. Isso significa que ela pode ser facilmente visualizada com um campo vetorial. Esse campo vetorial vive no domínio de f, que é o plano xy.
Esse campo vetorial é frequentemente chamado de campo gradiente de f.
Gradiente de f(x,y)=x2xy como um campo vetorial.
Pergunta para reflexão: por que os vetores nesse campo vetorial são tão pequenos na faixa diagonal crescente no meio do plano xy?
Destacar região vazia.

Exemplo 2: três dimensões

Qual é o gradiente de f(x,y,z)=xxy+z2?
Escolha 1 resposta:

f é uma função com entrada e saída tridimensionais. Como tal, ela é facilmente visualizada com um campo vetorial no espaço tridimensional.
Invólucro do vídeo da Khan Academy

Interpretação do gradiente

Em cada um dos exemplos acima, nós imaginamos f como um campo vetorial, mas como devemos interpretar esses campos vetoriais?
De maneira concreta, vamos pensar no caso em que a entrada de f é bidimensional. O gradiente transforma cada ponto de entrada (x0,y0) no vetor
f(x0,y0)=[fx(x0,y0)fy(x0,y0)].
O que o vetor nos diz sobre o comportamento da função em torno do ponto (x0,y0)?
Conceito da subida mais íngreme.
Pense no gráfico de f como um terreno com colinas. Se você está parado no ponto logo acima — ou abaixo — do ponto (x0,y0), a inclinação do terreno depende de em qual direção você caminhar. Por exemplo, se você der um passo na direção de x positivo, a inclinação será fx; se você der um passo na direção de y positivo, a inclinação será fy. Mas, na maioria das direções, as inclinações são uma combinação dos dois casos.
A coisa mais importante para se lembrar sobre o gradiente: o gradiente de f, se avaliado no ponto (x0,y0), apontará para a direção onde a subida é mais íngreme.
Então, se você andar na direção do gradiente, estará indo direto para o topo da colina. De maneira semelhante, a magnitude do vetor f(x0,y0) nos diz qual é a inclinação da colina naquela direção.
Não fica imediatamente claro por que colocar as derivadas parciais em um vetor dá a você a inclinação de subida mais íngreme, mas isso será explicado assim que chegarmos às derivadas direcionais.
Quando as entradas de uma função f estão em mais de duas dimensões, nós não podemos mais visualizar facilmente o gráfico como um terreno com colinas. Dito isso, os mesmos conceitos subjacentes se mantêm. Mesmo quando o domínio de f é bidimensional, tridimensional, ou tem um milhão de dimensões: o gradiente de f nos dará um vetor naquele domínio que aponta na direção que faz a função f aumentar o mais rapidamente possível.

Exemplo 3: como os máximos locais se parecem

Considere a função f(x,y)=x4+4(x2y2)3. Qual é o gradiente dessa função?
Escolha 1 resposta:

É assim que o gráfico de f se parece:
Gráfico de f(x,y)=x4+4(x2y2)3
Note que existem 2 picos. É assim que o campo vetorial de f se parece — vetores mais vermelhos devem ser entendidos como mais longos e vetores mais azuis devem ser entendidos como mais curtos:
Os dois pontos de entrada que correspondem aos cumes no gráfico de f estão rodeados por flechas direcionadas a estes pontos. Por que?
Isso acontece porque perto do topo da colina, a direção da subida mais íngreme aponta para o pico.
Pergunta para reflexão: como deverá ser o campo gradiente de uma função perto do mínimo local dessa função?

O gradiente é perpendicular às curvas de nível

Como os campos vetoriais, mapas de contorno são também desenhados no domínio de uma função, então devemos nos perguntar o que acontece se o campo vetorial de f estiver posicionado no topo do mapa de contorno correspondente de f.
Por exemplo. vamos considerar a função f(x,y)=xy:
Mapa de contorno de xy
Campo gradiente de xy
Mapa de contorno e campo gradiente xy
Quando olhamos para a figura acima percebemos uma coisa interessante: cada vetor é perpendicular a linha de contorno que ele toca.
Para entendermos por que isso é verdade, vamos examinar uma linha de contorno em particular, por exemplo, aquela que representa a saída dois, e examinar de perto um ponto na linha. Sabemos que o gradiente f aponta para a direção em que o valor de f aumenta mais rápido. Há duas maneiras de pensarmos sobre essa direção:
  1. Escolha um passo de tamanho fixo e encontre a direção na qual o valor de f mais cresce.
    Dados passos constantes distantes de um ponto em particular, o gradiente será aquele que aumentar mais o valor de f.
    Figura 1
  2. Escolha um aumento fixo em f e encontre a direção na qual o passo para atingir esse aumento de f seja mais curto.
    Dados passos que aumentam o valor de f para um determinado tamanho, a direção do gradiente será o mais curto entre eles.
    Figura 2
De qualquer forma, você está tentando maximizar a inclinação, tanto maximizando a ascensão vertical ou minimizando o deslocamento horizontal.
Os mapas de contorno fornecem uma boa ilustração de como essa segunda perspectiva pode parecer. Na Figura 2 acima, há uma segunda linha de contorno representando 2,1, que é só um pouco maior que o valor de 2 representado pela linha inicial. O gradiente de f deve apontar na direção que chegará a essa segunda linha com o passo mais curto possível.
Quanto mais ampliamos a imagem, mais essas linhas irão parecer linhas retas e paralelas. O passo mais curto de uma reta para outra reta paralela será sempre perpendicular às duas retas, portanto, o gradiente vai parecer perpendicular à linha de contorno.

O operador del

Em cálculo de múltiplas variáveis — e além — a palavra operador aparece bastante. Pode soar um pouco extravagante, mas, na maioria das vezes, você pode pensar em operador como uma "coisa que transforma uma função em outra".
A derivada é um exemplo de operador, já que transforma a função f em uma nova função f. Operadores diferenciais são operadores que estendem a ideia de uma derivada para um contexto totalmente diferente.
Exemplo de operadores diferenciais
NomeSímboloExemplo
Derivadaddxddx(x2)=2x
Derivada parcialxx(x2xy)=2xy
Gradiente(x2xy)=[2xyx]
Esse símbolo, , é chamado de nabla ou del. Tipicamente, nabla se refere ao próprio símbolo enquanto del se refere à operação que ele representa. Isso pode ser confuso, porque del também pode se referir ao símbolo , mas desde quando as terminologias da matemática são razoáveis?
Seja lá como vamos chamá-lo, o operador pode ser considerado, livremente, como um vetor dos operadores parciais da derivada:
=[xy]
Isso não é uma definição real. Pra começar, a dimensão desse vetor não está definida, uma vez que isso depende de quantas entradas existem na função aplicada. Além disso, ela está considerando as coisas de maneira muito rápida e livre para fazer um vetor de operadores. porém, como, na prática, o significado geralmente é claro, as pessoas raramente se preocupam com isso.
Imagine "multiplicar" esse vetor por uma função de valor escalar:
f=[xy]f=[fxfy]
Claro, isso não é uma multiplicação, você só está resolvendo cada operador derivada parcial na função. No entanto, essa é uma maneira super útil de entender , já que ele aparecerá novamente no contexto de várias operações que iremos aprender mais tarde: divergência, mola, e a equação de Laplace.

Resumo

  • O gradiente de uma função multivariável de valores escalares f(x,y,), denotado f, contém todas as informações sobre suas derivadas parciais em um vetor:
    f=[fxfy]
    Em particular, isso significa que f é uma função vetorial.
  • Imagine que você está parado em um ponto (x0,y0,) no domínio de f, o vetor f(x0,y0,) diz qual direção você deverá tomar para o valor de f aumentar mais rápido.
  • Esses vetores gradientes f(x0,y0,) também são perpendiculares às linhas de contorno de f.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.