Multivariate Verteilung


Multivariate Verteilung

Die Wahrscheinlichkeitsverteilung einer mehrdimensionalen Zufallsvariable nennt man multivariate Verteilung oder auch mehrdimensionale Verteilung.

Inhaltsverzeichnis

Einführendes Beispiel

Wir betrachten zwei Zufallsexperimente.

Das erste besteht aus einem zweimaligem Würfeln mit einem idealen Würfel. Dies ist äquivalent zu einem Urnenexperiment mit sechs Kugeln, wobei zweimal mit Zurücklegen gezogen wird. Es gibt 36 mögliche Ergebnispaare (da wir die Reihenfolge des Würfeln bzw. der Ziehung berücksichtigen), und alle 36 Möglichkeiten sind gleichwahrscheinlich, haben also Wahrscheinlichkeit 1/36.

Das zweite Experiment soll nun ein ähnliches Urnenexperiment sein, aber ohne Zurücklegen. In diesem Fall kommen die Ergebnisse (1,1),(2,2),...,(6,6) nicht vor, da die i-te Kugel beim zweiten Ziehen nicht vorkommen kann, wenn sie bereits bei der ersten Ziehung herausgenommen wurde. Die übrigen 30 Paare sind gleichwahrscheinlich und haben daher Wahrscheinlichkeit 1/30.

Diese beiden Experimente ergeben nun zweidimensionale diskrete Zufallsvariablen Z1 und Z2, welche die gleichen Randverteilungen haben (jede Zahl von 1 bis 6 ist bei beiden Experimenten in beiden Ziehungen gleichwahrscheinlich und tritt mit Wahrscheinlichkeit 1/6 auf).

Jedoch sind die beiden Ziehungen im ersten Experiment unabhängig, da die gezogene Kugel zurückgelegt wird, während sie im zweiten Experiment nicht unabhängig sind. Das wird am deutlichsten, wenn man sich klarmacht, dass die Paare (1,1),(2,2),...,(6,6) bei einem unabhängigen Experiment jeweils mit Wahrscheinlichkeit 1/36 vorkommen müssen (Produkt der Randwahrscheinlichkeiten 1/6), sie aber beim zweiten Experiment überhaupt nicht auftreten können (Wahrscheinlichkeit 0 haben), da die Kugel nicht zurückgelegt wird.

Die Verteilungen von Z1 und Z2 sind daher verschieden; es handelt sich also um ein Beispiel zweier unterschiedlicher diskreter multivariater Verteilungen mit gleichen Randverteilungen.

Zweidimensionale Verteilungsfunktion

10000 Stichproben einer mit der Clayton-Copula modellierten Verteilung (mit α = 2.88), bei der die Randverteilungen 1-dimensionale Standardnormalverteilungen sind.

Die Verteilungsfunktion einer zweidimensionalen Zufallsvariablen Z=(X,Y) ist folgendermaßen definiert:

F_Z(x,y)=P(X \le x, Y \le y) .

Falls die betrachtete Zufallsvariable Z eine (zweidimensionale) Dichte fX,Y besitzt, dann ist die Verteilungsfunktion

F_Z\left( x,y\right)= \int_{-\infty}^{x}\int_{-\infty}^{y} 
f_{X,Y}\left(u,v\right) \mathrm{d} u \, \mathrm{d}v.

Wenn die Zufallsvariable diskret ist, dann kann man die gemeinsame Verteilung mit Hilfe bedingter Wahrscheinlichkeiten so schreiben:


\begin{align}
\mathrm{P}(X=x\ \mathrm{und}\ Y=y) & {} = \mathrm{P}(Y=y \mid X=x) \cdot \mathrm{P}(X=x) \\
& {} = \mathrm{P}(X=x \mid Y=y) \cdot \mathrm{P}(Y=y)
\end{align}

und im stetigen Fall entsprechend

f_{X,Y}(x,y) = f_{Y|X}(y|x)f_X(x) = f_{X|Y}(x|y)f_Y(y)\;

Hier sind fY|X(y|x) und fX|Y(x|y) die bedingten Dichten (Y unter der Bedingung X = x, bzw. von X unter der Bedingung Y = y) und fX(x), fY(y) die Dichten der Randverteilungen von X und Y.

In der Abbildung ist ein Beispiel für die Modellierung der Abhängigkeitsstruktur mit Hilfe von Copulas gezeigt. Insbesondere ist das ein Beispiel dafür, dass eine bivariate Zufallsvariable mit normalen Randverteilungen nicht bivariat normalverteilt sein muss.

Der allgemeine mehrdimensionale Fall

Besitzt die n-dimensionale Zufallsvariable Z=(X_1,\dots,X_n) eine Dichte, dann ist die Verteilungsfunktion analog zum zweidimensionalen Fall

F_Z \left(x_1,\dots,x_n\right) = \int_{-\infty}^{x_1} \dots \int_{-\infty}^{x_n} 
f_{X_1,\dots,X_n}\left(u_1,\dots,u_n\right) \mathrm{d} u_1 \dots \mathrm{d} u_n.

Es gibt für Randverteilungen mehr Möglichkeiten als im zweidimensionalen Fall, da nun Randverteilungen für jede niedrigere Dimension 1\le k<n existieren und man {n \choose k} Möglichkeiten hat, den Unterraum auszuwählen. Beispielsweise gibt es im dreidimensionalen Fall 3 eindimensionale und 3 zweidimensionale Randverteilungen.

Gemeinsame Verteilung von unabhängigen Zufallsvariablen

Wenn für diskrete Zufallsvariablen \ P(X = x \ \mbox{und} \ Y = y ) = P( X = x) \cdot P( Y = y) für alle x und y gilt, oder aber für stetige Zufallsvariablen \ f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y) für alle x und y, dann sind X und Y unabhängig.

Siehe auch

Literatur

  • Mardia, KV, Kent, JT, Bibby, JM: Multivariate Analysis, New York 1979
  • Fahrmeir, Ludwig, Hamerle, Alfred, Tutz, Gerhard (Hrsg): Multivariate statistische Verfahren, New York 1996
  • Hartung, Joachim, Elpelt, Bärbel: Multivariate Statistik, München, Wien 1999



Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Multivariate Normalverteilung — Die gemeinsame Wahrscheinlichkeitsverteilung mehrerer Zufallsvariablen nennt man multivariate Verteilung oder auch mehrdimensionale Verteilung. Inhaltsverzeichnis 1 Formale Darstellung 2 Ausgewählte multivariate Verteilungen 3 Die multivariate… …   Deutsch Wikipedia

  • Multivariate — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • Multivariate Analyse — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • Multivariate Analysemethoden — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • Multivariate Analysen — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • Multivariate Statistik — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • Multivariate Untersuchung — Mit Multivariaten Verfahren (Multivariate Analyse(methoden), Abk.: MVA) werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer… …   Deutsch Wikipedia

  • multivariate distribution — daugiamatis skirstinys statusas T sritis fizika atitikmenys: angl. multivariate distribution vok. mehrdimensionale Verteilung, f rus. многомерное распределение, f pranc. distribution multivariée, f …   Fizikos terminų žodynas

  • Gauss-Verteilung — Dichten normalverteilter Zufallsgrößen Die Normal oder Gauß Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß Funktion, Gauß Kurve, Gauß… …   Deutsch Wikipedia

  • Gausssche Verteilung — Dichten normalverteilter Zufallsgrößen Die Normal oder Gauß Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß Funktion, Gauß Kurve, Gauß… …   Deutsch Wikipedia