If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Tratamento mais formal da regra da cadeia multivariável

Para aqueles que quiserem ver como a regra da cadeia multivariável se parece no contexto das definições de limite de diversas formas da derivada. Versão original criada por Grant Sanderson.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2MP - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos realizar uma formalização da regra da cadeia multivariável. Por esse motivo, eu diria que este é um vídeo mais opcional. Mas é interessante você assistir, se tiver vontade de conhecer essa formalização. Nos últimos vídeos, eu falei sobre essa regra da cadeia multivariável e falei algumas coisas que muitas pessoas podem não concordar. Por exemplo, eu calculei a derivada de uma função em relação a "t" e aí multipliquei isso com uma quantidade infinitesimal dt. Só que eu falei que esses dt podem ser cancelados. Pode ser que algumas pessoas olhem para isso e acabem dizendo: "Ei! Isso é uma derivada, é um operador diferencial! Você está tratando isso de uma forma incorreta!" Embora fazer isso através de uma ideia intuitiva seja algo muito bom, é ideal que a gente pense nessa derivada utilizando argumentos mais formais. Pensando nisso, o que eu quero fazer neste vídeo é apresentar os argumentos formais da regra da cadeia multivariável. E, apenas para nos lembrar da configuração do que estamos falando, vamos dizer que você esteja pensando em uma função com o valor vetorial "v", onde isso recebe uma entrada "t" que vive em uma reta numérica. Aí a gente mapeia isso para algum tipo de espaço de alta dimensão. No caso mais simples, você pode pensar nisso como um espaço bidimensional. Mas talvez seja um espaço tridimensional ou, quem sabe, um espaço com 100 dimensões. Você não tem literalmente que estar visualizando isso. Aí, esta função "f", de alguma forma, pega esse espaço de 100 dimensões (ou bidimensional, ou tridimensional, ou seja lá o que for), mapeia esse espaço e o leva para esta reta numérica. Portanto, o efeito geral da função formada por esta composição vai apenas receber um número verdadeiro e dar como saída um número real. Olhando isso, a gente chega à conclusão que esta é uma função de variável única. Sendo assim, se a gente quiser determinar a derivada desta função, a primeira coisa que vem à nossa mente é calcular a derivada comum em vez da derivada parcial, ou do gradiente, ou de algo parecido. Porém, devido ao fato desta função ter uma função intermediária e passar por um espaço multidimensional precisamos ter um gradiente e uma derivada de valor vetorial. Bem, como argumento formal, a primeira coisa que você pode fazer é apenas escrever a definição formal de uma derivada, que, neste caso, é um limite. Definições de derivadas sempre vão ter algum tipo de limite com uma variável tendendo a zero. E aqui você está vagamente pensando em "h" como sendo dt, não é? Você pode escrever dt, não tem problema. Mas é comum usar o "h" só porque isso pode ser usado para qualquer quantidade diferencial. E lembre-se: este "h" tem que estar no denominador, porque você está pensando nisso como um dt. E no numerador colocamos esta função, que terá como entrada a função intermediária de "t" mais esta pequena variação em "t". O que eu quero dizer é que você vai colocar aqui "f", mas não apenas de v(t), mas sim de v(t + h). Aí você subtrai disso o f(v(t)), que é o valor original da função no ponto em questão. Então, é basicamente isso que encontramos quando aplicamos a definição formal da derivada comum nesta função que possui uma composição. Mas e agora, o que fazemos? Isto deve ser igual ao quê? Eu acho interessante a gente pensar novamente na forma intuitiva aqui, principalmente nas ideias que apresentamos quando a gente conversou sobre a regra da cadeia multivariável pela primeira vez. Você imagina que está dando um pequeno empurrão dt aqui na entrada. Com isso, temos uma pequena variação na entrada. Isso acaba causando uma pequena variação no espaço intermediário de alguma forma. Podemos chamar essa variação de dv, ou seja, uma pequena variação no vetor. A forma como você pode pensar nisso é que você determina a derivada do valor vetorial em relação a "t" e aí multiplica isso por dt. Nós temos aqui uma espécie de constante de proporcionalidade entre o tamanho do empurrão em "t" e o vetor resultante. E claro, como temos esta expressão deste jeito, a gente pode imaginar que está cancelando os dt, como se tivéssemos uma fração. Eu já falei que essa não é a forma ideal de falar isso, mas ajuda a compreender essas ideias. Agora você me pergunta: de que forma essa variação dv vai causar uma deformação em "f"? Ou seja, qual será a variação no espaço de saída "f"? A variação causada em "f" na direção de dv, por qualquer que seja o vetor é, por definição, a derivada direcional. Tudo isso é apenas uma espécie de intuição. Mas como levamos isso tudo para a formalidade? Bem, neste espaço intermediário, temos que lidar com a derivada do valor vetorial "v". Portanto, pode ser uma boa coisa apenas escrever essa definição, não é? Então, colocamos aqui do lado a definição da derivada da função de valor vetorial "v". Novamente, teremos algo praticamente idêntico. Todas estas definições de derivadas realmente parecem ser a mesma coisa, porque o que estamos fazendo é determinar o limite quando "h" tende a zero de... Estamos pensando no "h" como sendo dt. Então, "h" fica aqui no denominador. E no numerador? Bem, como estamos querendo saber a respeito da variação de v(t), colocamos aqui v(t + h) menos o valor original de v(t). Lembre-se que v(t + h) e v(t) são vetores. Sendo assim, quando você atinge o limite, você está obtendo um vetor limitante, algo em seu espaço de alta dimensão. Não é apenas um número. Outra forma de escrever isso, e que de certa forma é mais útil, ou seja, é mais fácil de manipular, é dizendo que isto não é igual ao limite deste valor. Então, eu vou copiar tudo isto e colocar aqui embaixo. Sendo assim, o valor da nossa derivada vai ser igual a isto. Claro, sujeito a algum tipo de erro, que eu vou chamar de E(h), como se fosse uma função erro de "h". Provavelmente você já deve estar pensando que essa função de erro vai tender a zero quando "h" tender a zero, não é? É isso mesmo. Só que, desta forma, fica mais fácil de manipular as coisas. Eu vou dar um pequeno espaço aqui e multiplicar os dois lados desta expressão por "h". Portanto, esta é a nossa derivada de valor vetorial. Só que eu apenas a reescrevi, multiplicando por "h". Não se esqueça que devemos pensar neste "h" como um dt, ok? Sendo assim, talvez lá no fundo da sua mente, você esteja pensando em cancelar este dt com este "h", não é? E um detalhe interessante é que você também já esteja visualizando na sua mente este numerador aqui, este v(t + h) - v(t), sendo dv, a variação em "v", não é? Então, pensando em tudo isso, a gente pode cancelar este dt com este "h"? Bem, não. O caso é que a diferença entre o que fizemos antes, quando cancelamos aqueles dt, e o que temos aqui agora é esta função de erro, e que também tiramos tudo isso do limite. Então, não vamos cancelar nada e também vamos multiplicar o "h" com esta função de erro. Também podemos escrever esse produto entre o "h" e a função de erro de outra forma. Existe uma convenção muito interessante em análise. É que, em vez de escrever isso, a gente pode escrever aqui o(h). Isto não é literalmente uma função, é apenas um substituto para seja lá o que for, qualquer função que seja. Só que ela tem que satisfazer a propriedade que, quando assumirmos essa função e a dividirmos por "h", isso vai tender a zero quando "h" tender a zero. O que acaba sendo verdade aqui, porque você imagina pegar isto e dividir por "h" para cancelar este "h" e aí ter como resultado esta função de erro que vai tender a zero. Agora o que eu faço é usar toda esta expressão para encontrar o v(t + h). E o motivo de fazer isso é que, se a gente voltar aqui em cima, a gente vai perceber que tem um v(t + h) aqui na definição original. Então, esta é apenas uma forma da gente começar a desenvolver essa ideia um pouco melhor. Sendo assim, aqui eu escrevo que v(t + h), o valor de saída do pequeno empurrão, é igual ao valor original de v(t), mais este termo da derivada de "v" em relação a "t", e você pode pensar nisso como quase um polinômio de Taylor, onde isto é o termo de primeira ordem, e estamos avaliando isto em "t". Multiplicamos isto com "h", pelo valor do empurrão, mais o resto das coisas, que é apenas um pequeno o(h). Talvez aqui você deva estar pensando o seguinte: não seria possível jogar fora este o(h), já que isso não é uma função real? Ele simplesmente representa qualquer coisa. Talvez seja um valor absoluto, como a magnitude, porque neste caso esta é uma quantidade com um valor vetorial. E como você sabe, este erro é um vetor. Então, o tamanho deste vetor dividido pelo tamanho de "h" tende a zero. Portanto, esta é a principal ferramenta que vamos acabar usando. E esta é a forma de representar v(t + h). Agora, se a gente voltar aqui para a definição original da derivada do valor do vetor, eu vou copiar isto aqui e colar aqui. Esta é a definição original da derivada com a função composta. Agora, quando eu reescrevo isto utilizando todas as manipulações que acabamos de fazer, isto realmente ainda é um limite, porque "h" vai tender a zero. Mas aqui, quando eu coloco o "f", eu não vou colocar mais o f(v(t + h)). Eu vou colocar o que eu fiz aqui em cima. Sendo assim, teremos "f" de: v(t) mais a derivada de "v" em relação a "t" avaliada em "t", vezes "h". Novamente falando, isto é meio que um polinômio de Taylor. Temos aqui, ainda, mais o(h), lembrando que isto tende a zero quando "h" tende a zero. Aí a gente subtrai tudo isso com f(v(t)). Não podemos esquecer que estamos dividindo tudo isso por "h". Agora, uma coisa interessante é que, basicamente, quando estamos calculando o limite com "h" tendendo a zero, tudo que está aqui dentro acaba se resumindo a v(t) mais este termo vetorial aqui. Porque, com "h" tendendo a zero, esta componente o(h) tende a zero. Então, podemos ignorar este termo aqui. Aí temos isto aqui inserido nesta função. Não podemos esquecer que isto é "h" vezes algum tipo de vetor. Inclusive, se você se lembrar da nossa aula em que eu apresentei a definição formal da derivada direcional, isto é exatamente a definição formal da derivada direcional. Temos aqui um limite com "h" tendendo a zero e isto está multiplicando uma certa quantidade vetorial. Este vetor é um empurrãozinho no valor original. E aí estamos dividindo tudo por "h". Então, por definição, tudo isso é a derivada direcional na direção da derivada da função de "t". Eu estou escrevendo o v' em vez de colocar dv/dt aqui embaixo. E isto de "f" avaliando onde? O lugar que estamos começando é apenas v(t). Então, isto é em v(t). Esta é a resposta. Porque, quando você avalia a derivada direcional, a forma que você faz isso é determinar o gradiente de "f" avaliando em algum ponto inicial, que neste caso é a saída de v(t). Aí você faz o produto escalar disto com a derivada do valor vetorial. Bem, isto é a regra da cadeia multivariável. Aí, se você voltar aqui em cima e olhar tudo que a gente fez, isso realmente combina com a ideia de um empurrãozinho e do resultado disso. Principalmente porque a razão pela qual pensamos em usar a derivada de valor vetorial foi por causa dessa intuição. E a razão de toda a manipulação que eu fiz é só porque eu queria ser capaz de expressar como é um empurrãozinho para a entrada de "v". E que isso nada mais é do que o valor original mais um certo vetor aqui. Este foi um empurrão resultante no espaço intermediário. Eu queria expressar isso de uma forma formal. E claro, nós temos este tipo de termo que expressa algo que diminui muito rápido. Mas, uma vez que você expressa assim, você acaba chegando à definição da derivada direcional. Sendo assim, espero que este vídeo tenha conseguido mostrar um pouco melhor esse rigor matemático da regra da cadeia multivariável. Ah, um detalhe: eu não posso deixar de mencionar que existe mais uma generalização da regra da cadeia multivariável, só que para funções com valor vetorial. Eu vou falar com você sobre isso em outro momento, Principalmente quando a gente estiver fazendo uma conexão entre o cálculo de múltiplas variáveis e a álgebra linear. Mas, por enquanto, isso é tudo o que você precisa saber sobre a regra da cadeia multivariável, que serve para os casos em que temos uma função composta, com uma entrada e uma saída compostas por um número real. Espero que você tenha compreendido tudo que a gente conversou aqui e mais uma vez eu quero deixar para você um grande abraço e até a próxima!