Conteúdo principal
Curso: Cálculo multivariável > Unidade 2
Lição 5: Regra da cadeia multivariável- Regra da cadeia multivariável
- Introdução à regra da cadeia multivariável
- Intuição sobre a regra da cadeia multivariável
- Regra da cadeia multivariável
- Forma vetorial da regra da cadeia multivariável
- Regra da cadeia derivadas direcionais multivariáveis
- Tratamento mais formal da regra da cadeia multivariável
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Tratamento mais formal da regra da cadeia multivariável
Para aqueles que quiserem ver como a regra da cadeia multivariável se parece no contexto das definições de limite de diversas formas da derivada. Versão original criada por Grant Sanderson.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA2MP - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda
a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos realizar uma formalização
da regra da cadeia multivariável. Por esse motivo, eu diria que este
é um vídeo mais opcional. Mas é interessante você assistir, se tiver
vontade de conhecer essa formalização. Nos últimos vídeos, eu falei
sobre essa regra da cadeia multivariável e falei algumas coisas que muitas pessoas
podem não concordar. Por exemplo, eu calculei a derivada
de uma função em relação a "t" e aí multipliquei isso
com uma quantidade infinitesimal dt. Só que eu falei que esses dt
podem ser cancelados. Pode ser que algumas pessoas
olhem para isso e acabem dizendo: "Ei! Isso é uma derivada,
é um operador diferencial! Você está tratando isso
de uma forma incorreta!" Embora fazer isso através de uma ideia
intuitiva seja algo muito bom, é ideal que a gente pense nessa derivada
utilizando argumentos mais formais. Pensando nisso, o que eu quero fazer
neste vídeo é apresentar os argumentos formais
da regra da cadeia multivariável. E, apenas para nos lembrar da configuração
do que estamos falando, vamos dizer que você esteja pensando
em uma função com o valor vetorial "v", onde isso recebe uma entrada "t"
que vive em uma reta numérica. Aí a gente mapeia isso para algum tipo
de espaço de alta dimensão. No caso mais simples, você pode
pensar nisso como um espaço bidimensional. Mas talvez seja um espaço tridimensional ou, quem sabe,
um espaço com 100 dimensões. Você não tem literalmente
que estar visualizando isso. Aí, esta função "f", de alguma forma,
pega esse espaço de 100 dimensões (ou bidimensional, ou tridimensional,
ou seja lá o que for), mapeia esse espaço
e o leva para esta reta numérica. Portanto, o efeito geral da função formada
por esta composição vai apenas receber um número verdadeiro
e dar como saída um número real. Olhando isso, a gente chega à conclusão
que esta é uma função de variável única. Sendo assim, se a gente quiser determinar
a derivada desta função, a primeira coisa que vem à nossa mente
é calcular a derivada comum em vez da derivada parcial,
ou do gradiente, ou de algo parecido. Porém, devido ao fato desta função
ter uma função intermediária e passar por um espaço multidimensional precisamos ter um gradiente
e uma derivada de valor vetorial. Bem, como argumento formal,
a primeira coisa que você pode fazer é apenas escrever a definição formal
de uma derivada, que, neste caso, é um limite. Definições de derivadas sempre vão ter
algum tipo de limite com uma variável tendendo a zero. E aqui você está vagamente pensando em "h"
como sendo dt, não é? Você pode escrever dt, não tem problema. Mas é comum usar o "h" só porque isso
pode ser usado para qualquer quantidade diferencial. E lembre-se: este "h" tem que estar
no denominador, porque você está pensando nisso
como um dt. E no numerador colocamos esta função, que terá como entrada
a função intermediária de "t" mais esta pequena variação em "t". O que eu quero dizer
é que você vai colocar aqui "f", mas não apenas de v(t),
mas sim de v(t + h). Aí você subtrai disso o f(v(t)), que é o valor original da função
no ponto em questão. Então, é basicamente isso que encontramos quando aplicamos a definição formal
da derivada comum nesta função que possui uma composição. Mas e agora, o que fazemos?
Isto deve ser igual ao quê? Eu acho interessante a gente pensar
novamente na forma intuitiva aqui, principalmente nas ideias que apresentamos quando a gente conversou sobre a regra
da cadeia multivariável pela primeira vez. Você imagina que está dando
um pequeno empurrão dt aqui na entrada. Com isso, temos uma pequena variação
na entrada. Isso acaba causando uma pequena variação
no espaço intermediário de alguma forma. Podemos chamar essa variação de dv,
ou seja, uma pequena variação no vetor. A forma como você pode pensar nisso é que você determina a derivada
do valor vetorial em relação a "t" e aí multiplica isso
por dt. Nós temos aqui uma espécie de constante
de proporcionalidade entre o tamanho do empurrão em "t"
e o vetor resultante. E claro, como temos esta expressão
deste jeito, a gente pode imaginar que está cancelando
os dt, como se tivéssemos uma fração. Eu já falei que essa não é a forma ideal
de falar isso, mas ajuda a compreender essas ideias. Agora você me pergunta: de que forma
essa variação dv vai causar uma deformação em "f"? Ou seja, qual será a variação
no espaço de saída "f"? A variação causada em "f"
na direção de dv, por qualquer que seja o vetor é, por definição, a derivada direcional. Tudo isso é apenas
uma espécie de intuição. Mas como levamos isso tudo
para a formalidade? Bem, neste espaço intermediário, temos que lidar com a derivada
do valor vetorial "v". Portanto, pode ser uma boa coisa
apenas escrever essa definição, não é? Então, colocamos aqui do lado a definição
da derivada da função de valor vetorial "v". Novamente, teremos algo
praticamente idêntico. Todas estas definições de derivadas
realmente parecem ser a mesma coisa, porque o que estamos fazendo é determinar
o limite quando "h" tende a zero de... Estamos pensando no "h" como sendo dt. Então, "h" fica aqui no denominador. E no numerador? Bem, como estamos querendo
saber a respeito da variação de v(t), colocamos aqui v(t + h)
menos o valor original de v(t). Lembre-se que v(t + h) e v(t) são vetores. Sendo assim, quando você atinge o limite,
você está obtendo um vetor limitante, algo em seu espaço de alta dimensão.
Não é apenas um número. Outra forma de escrever isso,
e que de certa forma é mais útil, ou seja, é mais fácil de manipular, é dizendo
que isto não é igual ao limite deste valor. Então, eu vou copiar tudo isto
e colocar aqui embaixo. Sendo assim, o valor da nossa derivada
vai ser igual a isto. Claro, sujeito a algum tipo de erro,
que eu vou chamar de E(h), como se fosse uma função erro de "h". Provavelmente você já deve estar pensando
que essa função de erro vai tender a zero quando "h" tender a zero, não é? É isso mesmo. Só que, desta forma,
fica mais fácil de manipular as coisas. Eu vou dar um pequeno espaço aqui e multiplicar os dois lados
desta expressão por "h". Portanto, esta é a nossa derivada
de valor vetorial. Só que eu apenas a reescrevi,
multiplicando por "h". Não se esqueça que devemos pensar
neste "h" como um dt, ok? Sendo assim, talvez lá no fundo
da sua mente, você esteja pensando em cancelar
este dt com este "h", não é? E um detalhe interessante é que você
também já esteja visualizando na sua mente este numerador aqui, este v(t + h) - v(t),
sendo dv, a variação em "v", não é? Então, pensando em tudo isso,
a gente pode cancelar este dt com este "h"? Bem, não. O caso é que a diferença entre o que fizemos antes,
quando cancelamos aqueles dt, e o que temos aqui agora
é esta função de erro, e que também tiramos tudo isso do limite. Então, não vamos cancelar nada e também vamos multiplicar o "h"
com esta função de erro. Também podemos escrever esse produto
entre o "h" e a função de erro de outra forma. Existe uma convenção
muito interessante em análise. É que, em vez de escrever isso,
a gente pode escrever aqui o(h). Isto não é literalmente uma função, é apenas um substituto para seja lá
o que for, qualquer função que seja. Só que ela tem que satisfazer
a propriedade que, quando assumirmos essa função
e a dividirmos por "h", isso vai tender a zero
quando "h" tender a zero. O que acaba sendo verdade aqui,
porque você imagina pegar isto e dividir por "h" para cancelar este "h" e aí ter como resultado esta função
de erro que vai tender a zero. Agora o que eu faço é usar toda
esta expressão para encontrar o v(t + h). E o motivo de fazer isso é que,
se a gente voltar aqui em cima, a gente vai perceber que tem um v(t + h)
aqui na definição original. Então, esta é apenas uma forma da gente começar
a desenvolver essa ideia um pouco melhor. Sendo assim, aqui eu escrevo que v(t + h),
o valor de saída do pequeno empurrão, é igual ao valor original de v(t), mais este termo da derivada de "v"
em relação a "t", e você pode pensar nisso
como quase um polinômio de Taylor, onde isto é o termo de primeira ordem,
e estamos avaliando isto em "t". Multiplicamos isto com "h",
pelo valor do empurrão, mais o resto das coisas,
que é apenas um pequeno o(h). Talvez aqui você deva estar pensando
o seguinte: não seria possível jogar fora este o(h),
já que isso não é uma função real? Ele simplesmente representa
qualquer coisa. Talvez seja um valor absoluto,
como a magnitude, porque neste caso esta é uma quantidade
com um valor vetorial. E como você sabe, este erro é um vetor. Então, o tamanho deste vetor dividido
pelo tamanho de "h" tende a zero. Portanto, esta é a principal ferramenta
que vamos acabar usando. E esta é a forma de representar v(t + h). Agora, se a gente voltar aqui para a definição
original da derivada do valor do vetor, eu vou copiar isto aqui e colar aqui. Esta é a definição original da derivada
com a função composta. Agora, quando eu reescrevo isto utilizando
todas as manipulações que acabamos de fazer, isto realmente ainda é um limite,
porque "h" vai tender a zero. Mas aqui, quando eu coloco o "f",
eu não vou colocar mais o f(v(t + h)). Eu vou colocar o que eu fiz aqui em cima.
Sendo assim, teremos "f" de: v(t) mais a derivada de "v" em relação
a "t" avaliada em "t", vezes "h". Novamente falando, isto é meio que
um polinômio de Taylor. Temos aqui, ainda, mais o(h), lembrando que isto tende a zero
quando "h" tende a zero. Aí a gente subtrai tudo isso com f(v(t)). Não podemos esquecer
que estamos dividindo tudo isso por "h". Agora, uma coisa interessante
é que, basicamente, quando estamos calculando
o limite com "h" tendendo a zero, tudo que está aqui dentro acaba se resumindo
a v(t) mais este termo vetorial aqui. Porque, com "h" tendendo a zero,
esta componente o(h) tende a zero. Então, podemos ignorar este termo aqui. Aí temos isto aqui inserido nesta função. Não podemos esquecer
que isto é "h" vezes algum tipo de vetor. Inclusive, se você se lembrar
da nossa aula em que eu apresentei a definição formal
da derivada direcional, isto é exatamente a definição
formal da derivada direcional. Temos aqui um limite
com "h" tendendo a zero e isto está multiplicando
uma certa quantidade vetorial. Este vetor é um empurrãozinho
no valor original. E aí estamos dividindo tudo por "h". Então, por definição,
tudo isso é a derivada direcional na direção da derivada da função de "t". Eu estou escrevendo o v' em vez de colocar
dv/dt aqui embaixo. E isto de "f" avaliando onde? O lugar que estamos começando
é apenas v(t). Então, isto é em v(t). Esta é a resposta. Porque, quando você avalia a derivada
direcional, a forma que você faz isso é determinar o gradiente de "f" avaliando
em algum ponto inicial, que neste caso é a saída de v(t). Aí você faz o produto escalar disto
com a derivada do valor vetorial. Bem, isto é a regra
da cadeia multivariável. Aí, se você voltar aqui em cima
e olhar tudo que a gente fez, isso realmente combina com a ideia
de um empurrãozinho e do resultado disso. Principalmente porque
a razão pela qual pensamos em usar a derivada de valor vetorial foi por causa
dessa intuição. E a razão de toda a manipulação que eu fiz é só porque eu queria ser capaz
de expressar como é um empurrãozinho
para a entrada de "v". E que isso nada mais é do que o valor
original mais um certo vetor aqui. Este foi um empurrão resultante
no espaço intermediário. Eu queria expressar isso
de uma forma formal. E claro, nós temos este tipo de termo
que expressa algo que diminui muito rápido. Mas, uma vez que você expressa assim, você acaba chegando à definição
da derivada direcional. Sendo assim, espero que este vídeo
tenha conseguido mostrar um pouco melhor esse rigor matemático
da regra da cadeia multivariável. Ah, um detalhe:
eu não posso deixar de mencionar que existe mais uma generalização
da regra da cadeia multivariável, só que para funções com valor vetorial. Eu vou falar com você sobre isso
em outro momento, Principalmente quando a gente estiver
fazendo uma conexão entre o cálculo de múltiplas variáveis
e a álgebra linear. Mas, por enquanto, isso é tudo
o que você precisa saber sobre a regra da cadeia multivariável, que serve para os casos em que temos
uma função composta, com uma entrada e uma saída
compostas por um número real. Espero que você tenha compreendido
tudo que a gente conversou aqui e mais uma vez eu quero deixar para você
um grande abraço e até a próxima!