Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Derivada direcional (aprofundado)

Uma olhada mais detalhada na fórmula das derivadas direcionais, juntamente com uma explicação de por que o gradiente dá a inclinação do aclive máximo.

Contexto:

Este artigo é direcionado para aqueles que querem um conhecimento mais profundo da derivada direcional e sua fórmula.

Definição formal da derivada direcional

Há algumas razões pelas quais você deveria se importar com uma definição formal. Por um lado, entender realmente a definição formal de um novo conceito pode tornar claro o que realmente está acontecendo. Porém, mais importante do que isso, eu acho que o principal benefício que ela traz é a certeza de reconhecer quando tal conceito pode ou não aplicado.
Para aquecer, vamos rever a definição formal da derivada parcial, por exemplo, em relação a x:
fx(x0,y0)=limh0f(x0+h,y0)f(x0,y0)h
A relação entre a maneira informal de ler fx e a maneira formal de ler o lado direito da igualdade é a seguinte:
SímboloEntendimento informalEntendimento formal
xUm pequeno deslocamento na direção x.Uma variável limitante h que vai a 0, e será adicionada ao primeiro componente da entrada da função.
fA mudança resultante na saída de f após o deslocamento.A diferença entre f(x0+h,y0) e f(x0,y0), levada pelo mesmo limite de h0.
Também poderíamos escrever isso em notação vetorial, visualizando o ponto de entrada (x0,y0) como um vetor bidimensional.
x0=[x0y0]
Aqui, x0 é escrito em negrito para enfatizar seu caráter vetorial. É um pouco confuso usar x em negrito para a entrada toda em vez de alguma outra letra, já que a letra x já foi usada (sem estar em negrito) para denotar a primeira componente do vetor. Porém, como isso é convenção, vamos trabalhar com isso.
Ao invés de escrever a entrada "desviada" como (x0+h,y0), nós a escrevemos como x0+hi^, onde i^ é o vetor unitário na direção x:
fx(x0)=limh0f(x0+hi^)f(x0)h
Nessa notação, é muito mais fácil ver como generalizar a derivada parcial em relação a x para a derivada direcional na direção de qualquer vetor v:
vf(x0)=limh0f(x0+hv)f(x0)h
Neste caso, ao adicionar hv à entrada para uma variável limitante h0, formalizamos a ideia de um pequeno deslocamento na direção de v.

A busca pela relação entre definição e o cálculo

Calcular a derivada direcional envolve um produto escalar entre o gradiente f e o vetor v. Por exemplo, em duas dimensões, isso ficaria assim:
vf(x,y)=fv=[fxfy][v1v2]=v1fx(x,y)+v2fy(x,y)
Aqui, v1 e v2 são os componentes de v.
v=[v1v2]
A questão central é: o que essa fórmula tem a ver com a definição dada acima?

Explicando o deslocamento

O cálculo de vf pode ser visto como uma maneira de dividir o pequeno incremento na direção de v em seus componentes x e y.
Especificamente, você pode imaginar o seguinte procedimento:
  1. Comece em algum ponto (x0,y0).
  2. Escolha um pequeno valor para h.
  3. Adicione hv1 a x0, o que significa avançar ao ponto (x0+hv1,y0). Com base no que sabemos sobre derivadas parciais, isso vai alterar a saída da função em aproximadamente
hv1(fx(x0,y0))
  • Agora adicione hv2 a y0, o que nos leva para cima/baixo até o ponto (x0+hv1,y0+hv2). A alteração resultante em f é agora de
hv2(fy(x0+hv1,y0))
Somando os resultados dos passos 3 e 4, a alteração total na função ao mudar da entrada (x0,y0) para a entrada (x0+hv1,y0+hv2) é, aproximadamente
hv1(fx(x0,y0))+hv2(fy(x0+hv1,y0))
Isto é muito próximo da expressão da derivada direcional, que diz que a alteração em f por causa desse passo hv deve ser, aproximadamente
=hvf(x0,y0)=hvf(x0,y0)=hv1fx(x0,y0)+hv2fy(x0,y0)
Entretanto, isso difere ligeiramente do resultado do nosso raciocínio passo a passo, no qual a derivada parcial em relação a y é tomada no ponto (x0+hv1,y0), e não no ponto (x0,y0).
Felizmente, estamos considerando valores muito pequenos para h. Na verdade, tecnicamente falando, deveríamos falar sobre o limite quando h0. Portanto, calcular fy em (x0+hv1,y0) é quase o mesmo que calculá-la em (x0,y0). Além disso, quando h se aproxima de 0, a diferença entre esses dois valores diminui, mas temos que assumir que f é contínua.

Por que o gradiente aponta na direção de maior inclinação?

Tendo aprendido sobre as derivadas direcionais, podemos agora entender porque a direção do gradiente é a direção de maior inclinação.
Especificamente, essa é a questão.
Preparação:
  • Seja f uma função real, de várias variáveis. Por exemplo, f(x,y)=x2+y2.
  • Seja (x0,y0) um ponto de entrada específico
  • Considere todas as direções possíveis, isto é, todos os vetores unitários u^ no domínio de f.
Questão (informal): se partimos de (x0,y0), em que direção devemos caminhar para que a saída de f aumente mais rapidamente?
Questão (formal): qual vetor unitário u^ maximiza a derivada direcional na direção de u^?
u^f(x0,y0)=u^f(x0,y0)Maximizar essa grandeza
A famosa desigualdade triangular nos diz que isso será maximizado pelo vetor unitário na direção de f(x0,y0).
Note que o fato de o gradiente apontar na direção da maior inclinação é uma consequência do fato mais fundamental de que todas as derivadas direcionais requerem o cálculo do produto escalar com f.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.