Verallgemeinerte Kettenregel


Verallgemeinerte Kettenregel

Die verallgemeinerte Kettenregel ist in der mehrdimensionalen Analysis eine Verallgemeinerung der Kettenregel von Funktionen einer Variablen auf Funktionen und Abbildungen mehrerer Variablen. Sie besagt, dass die Verkettung von (total) differenzierbaren Abbildungen bzw. Funktionen differenzierbar ist, und gibt an, wie sich die Ableitung dieser Abbildung berechnet.

Inhaltsverzeichnis

Einleitung

Ist f \colon \R^n \to \R^m eine differenzierbare Abbildung, so ist die Ableitung von f im Punkt p \in \R^n, geschrieben f'(p)\,, Df(p) oder Dfp, eine lineare Abbildung, die Vektoren im Punkt p \in \R^n auf Vektoren im Bildpunkt f(p) \in \R^m abbildet. Man kann sie durch die Jacobi-Matrix darstellen, die mit Jf(p), \frac{\partial f}{\partial x}(p) oder auch mit Df(p) bezeichnet wird, und deren Einträge die partiellen Ableitungen sind:

J_f(p) = \left(\frac{\partial f_i}{\partial x_j}(p)\right)_{ij} = 
\begin{pmatrix}
\frac{\partial f_1}{\partial x_1}(p)&\ldots&\frac{\partial f_1}{\partial x_n}(p)\\
\vdots & &\vdots \\
\frac{\partial f_m}{\partial x_1}(p)&\ldots&\frac{\partial f_m}{\partial x_n}(p)
\end{pmatrix}

Die Kettenregel besagt nun, dass die Ableitung der Verkettung zweier Abbildungen gerade die Verkettung der Ableitungen ist, bzw. dass die Jacobi-Matrix der Verkettung das Matrizenprodukt der Jacobi-Matrix der äußeren Funktion mit der Jacobi-Matrix der inneren Funktion ist.

Satz

Sind f\colon\mathbb R^n\to\mathbb R^l und g\colon\mathbb R^l\to\mathbb R^m differenzierbare Abbildungen, so ist auch die Verkettung h = g \circ f \colon \R^n \to \R^m differenzierbar. Ihre Ableitung im Punkt p \in \R^n ist die Hintereinanderausführung der Ableitung von f im Punkt p und der Ableitung von g im Punkt f(p):

D(g \circ f)_p = Dg_{f(p)} \circ Df_p

bzw.

(g\circ f)'(p)=g'(f(p))\circ f'(p).

Für die Jacobi-Matrizen gilt entsprechend:

J_{g \circ f}(p) = J_g(f(p)) \cdot J_f(p),

bzw.

\frac{\partial (g \circ f)}{\partial x}(p) = 
\frac{\partial g}{\partial y}(f(p)) \cdot \frac{\partial f}{\partial x}(p)

wobei der Punkt die Matrizenmultiplikation bezeichnet. Ausgeschrieben mit den Komponenten der Abbildungen und den partiellen Ableitungen:

\frac{\partial h_i}{\partial x_j}(p)=\sum_{k=1}^l\frac{\partial g_i}{\partial y_k}(f(p))\cdot\frac{\partial f_k}{\partial x_j}(p)

Höhere Differenzierbarkeit

Sind, für ein k \in \N, die Abbildungen f und g von der Klasse Ck, das heißt k-mal stetig differenzierbar, so ist auch g \circ f von der Klasse Ck. Dies ergibt sich durch wiederholtes Anwenden der Kettenregel und der Produktregel auf die partiellen Ableitungen der Komponentenfunktionen.

Spezialfall n = m = 1

Häufig möchte man die Ableitung einer gewöhnlichen reellen Funktion h\colon \R \to \R bestimmen, die aber über einen mehrdimensionalen "Umweg" definiert ist:

h = g \circ f mit f\colon \R \to\R^l und g\colon \R^l \to \R.

In diesem Fall lässt sich die Kettenregel wie folgt schreiben:

h'(x) =  
\frac{\partial g}{\partial y_1}(f(x)) \cdot f_1'(x) + \dots + 
\frac{\partial g}{\partial y_l}(f(x)) \cdot f_l'(x)
=\operatorname{grad}\ g(f(x)) \cdot f'(x)

Der letzte Malpunkt bezeichnet dabei das Skalarprodukt zwischen zwei Vektoren, dem Gradienten

\operatorname{grad}\ g = \nabla g = \left(\frac{\partial g}{\partial y_1}, \ldots, \frac{\partial g}{\partial y_l}\right)

der Funktion g, ausgewertet an der Stelle f(x), und der vektorwertigen Ableitung

f'(x) = \left(f_1'(x),\ldots, f_l'(x)\right) der Abbildung f[1]

Kettenregel und Richtungsableitung

Für den Spezialfall f \colon \R \to \R^l, f(t) = a + tv, mit a, v \in \R^l, ist

(g \circ f)'(0) = \left.\frac {d}{dt}\right|_{t=0} g(a + tv) = D_v g(a)

die Richtungsableitung von g im Punkt a in Richtung des Vektors v. Aus der Kettenregel folgt dann

(g \circ f)'(0) = \operatorname{grad}\ g(f(0)) \cdot f'(0) = \operatorname{grad}\ g(a) \cdot v.

Es ergibt sich also die übliche Formel für die Berechnung der Richtungsableitung:

D_v g(a) = \operatorname{grad}\ g(a) \cdot v [1]

Beispiel

h(x) = g(cos x,sin x)

In diesem Beispiel bildet g die äußere Funktion, abhängig von y = (y1,y2). Somit ist

g'(y) = \begin{pmatrix} \frac{\partial g}{\partial y_1} & \frac{\partial g}{\partial y_2} \end{pmatrix}

Als innere Funktion setzen wir f(x) = (f1(x),f2(x)) = (cos x,sin x), abhängig von der reellen Variablen x. Ableiten ergibt

f'(x) = \begin{pmatrix} f_1'(x) \\ f_2'(x) \end{pmatrix} = \begin{pmatrix} -\sin x \\ \cos x \end{pmatrix}

Nach der allgemeinen Kettenregel gilt daher:


\begin{align} 
h'(x) &= g'(f(x)) \cdot f'(x) = 
\left. \begin{pmatrix} \frac{\partial g}{\partial y_1} & \frac{\partial g}{\partial y_2} \end{pmatrix} \right|_{y = f(x)} \cdot \begin{pmatrix} -\sin x \\ \cos x \end{pmatrix}\\
&= - \sin{x} \cdot \frac{\partial g}{\partial y_1}(\cos{x},\sin{x}) + \cos{x} \cdot \frac{\partial g}{\partial y_2}(\cos{x},\sin{x})\end{align}

Ein additives Beispiel mittels Substitution

Die Frage wie man die Ableitung von \displaystyle f(x)=x^x bestimmt, wird meist mit einem bekannten „Trick“ beantwortet, dies als \displaystyle e^{x \log x} zu schreiben und dann mittels Produkt- und Kettenregel auszuwerten. Es ergibt (x \frac 1x + 1\log x)e^{x \log x} = x^x + x^x\log x .

Eine weniger trickreiche, unmotivierte oder spezielle Methode zur Lösung, ist die folgende mit Hilfe der verallgemeinerten Kettenregel:

Sei \displaystyle g(x,y)=x^y. Dann ist \frac{\partial g}{\partial x} = y \, x^{y-1} und \frac{\partial g}{\partial y} = x^y \log x .

Mit \displaystyle f(x)=g(h_1(x),h_2(x)), wobei \displaystyle h_1(x)=x, h_2(x)=x erhält man

f'(x) = \frac{\partial g}{\partial x}(x,x) h_1'(x) + \frac{\partial g}{\partial y}(x,x) h_2'(x) = x \,x^{x-1}\, 1 + x^x \log x \,1 = x^x + x^x\log x.

In Worten:

1. Man leitet xx 'nach dem x in der Basis ab', wobei man das x im Exponenten wie eine Konstante betrachtet,

2. man leitet xx 'nach dem x im Exponenten ab', wobei man das x in der Basis wie eine Konstante betrachtet,

3. man addiert die Ergebnisse.

Der "Trick" hierbei ist, dass man x in der Basis und x im Exponenten, obwohl sie gleichlauten, unterscheidet.

Es ist eine Folgerung aus der verallgemeinerten Kettenregel, dass diese erstaunlich einfache Prozedur korrekt ist.

Diese Herleitung enthält mehr Einsicht, warum das Ergebnis so ist, wie es ist, als der "Trick" mit der Exponentialfunktion. Außerdem ist diese Herleitung allgemeiner anwendbar, z.B. liefert sie ganz einfach auch die Leibnizregel für Parameterintegrale.

Verallgemeinerung auf differenzierbare Mannigfaltigkeiten

Sind M und N differenzierbare Mannigfaltigkeiten und f\colon M \to N eine differenzierbare Abbildung, so ist die Ableitung \,f'(p) oder Dfp von f im Punkt p \in M eine lineare Abbildung vom Tangentialraum von M im Punkt p in den Tangentialraum von N im Bildpunkt f(p):

Df_p \colon T_p M \to T_{f(p)}N

Andere Bezeichnungen dafür sind: Differential (dann oft dfp geschrieben), Pushforward (f_{\ast p}) und Tangetialabbildung (Tpf).

Die Kettenregel besagt dann: Sind M, N und P differenzierbare Mannigfaltigkeiten und ist h  = g \circ f \colon M \to P die Verkettung der differenzierbaren Abbildungen f\colon M \to N und g\colon N \to P, so ist auch h differenzierbar und für die Ableitung im Punkt p \in M gilt :

Dh_p = Dg_{f(p)} \circ Df_p

Kettenregel für Fréchet-Ableitungen

Die Kettenregel gilt ganz entsprechend für Fréchet-Ableitungen.

Gegeben seien Banach-Räume X, Y und Z, offene Teilmengen U \subset X und V \subset Y und Abbildungen B \colon U \to Y und A \colon V \to Z.

Ist B an der Stelle \varphi \in U und A an der Stelle B(\varphi) \in V differenzierbar, so ist auch die Verkettung A \circ B \colon U \to Z an der Stelle φ differenzierbar und es gilt

(A \circ B)'(\varphi) = A'(B(\varphi)) \circ B'(\varphi)

Einzelnachweise und Fußnoten

  1. a b Physiker schreiben hier die Vektoren, \,f'(x) bzw. v, mit Vektorpfeilen (\vec f'(x), \vec v) oder mit Fettdruck (\mathbf{f'}(x) bzw. \mathbf v). Das hat u.a. den Vorteil, dass man sofort erkennt, dass x im Gegensatz zu \mathbf v eine eindimensionale Variable ist.

Literatur


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Kettenregel — Die Kettenregel ist eine der Grundregeln der Differentialrechnung. Sie trifft Aussagen über die Ableitung einer Funktion, die sich selbst als Verkettung von zwei differenzierbaren Funktionen darstellen lässt. Kernaussage der Kettenregel ist dabei …   Deutsch Wikipedia

  • Verkettung von Funktionen — Die Kettenregel ist eine der Grundregeln der Differentialrechnung. Sie trifft Aussagen über die Ableitung einer Funktion, die sich selbst als Verkettung von zwei differenzierbaren Funktionen darstellen lässt. Kernaussage der Kettenregel ist dabei …   Deutsch Wikipedia

  • Totales Differential — Das totale Differential (auch vollständiges Differential) ist ein Begriff aus der Differentialrechnung und bezeichnet das Differential einer Funktion, insbesondere bei Funktionen mehrerer Variablen. Zu einer gegebenen differenzierbaren Funktion… …   Deutsch Wikipedia

  • Differentialrechnung — Die Differential bzw. Differenzialrechnung ist ein wesentlicher Bestandteil der Analysis und damit ein Gebiet der Mathematik. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst… …   Deutsch Wikipedia

  • Ableitung (Mathematik) — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia

  • Ableitungsregel — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia

  • Ableitungsregeln — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia

  • Differentialquotient — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia

  • Differentiation — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia

  • Differenzialquotient — Die Differential bzw. Differenzialrechnung ist ein Gebiet der Mathematik und ein wesentlicher Bestandteil der Analysis. Sie ist eng verwandt mit der Integralrechnung, mit der sie unter der Bezeichnung Infinitesimalrechnung zusammengefasst wird.… …   Deutsch Wikipedia