Pareto-Verteilung

Die Verteilung der Einwohnerzahlen deutscher Städte (Histogramm in gelb) kann gut durch eine Pareto-Verteilung (blau) beschrieben werden.

Die Pareto-Verteilung, benannt nach Vilfredo Pareto (1848–1923), ist eine stetige Wahrscheinlichkeitsverteilung auf einem rechtsseitig unendlichen Intervall $[x_{\min},\infty)$ . Sie ist skaleninvariant und genügt einer Potenzverteilung. Für kleine Exponenten gehört sie zu den Endlastigen Verteilungen.

Die Verteilung wurde zunächst zur Beschreibung der Einkommensverteilung Italiens verwendet. Paretoverteilungen finden sich charakteristischerweise dann, wenn sich zufällige, positive Werte über mehrere Größenordnungen erstrecken und durch das Einwirken vieler unabhängiger Faktoren zustande kommen. Verteilungen mit ähnlichen Eigenschaften sind die Zipfverteilung und das Benfordsche Gesetz.

Begriffsgeschichte

Im zweiten Band des Cours d'économie politique von Vilfredo Pareto (1897) legt dieser dar, dass sich die Anzahl der Personen, welche innerhalb eines Staates ein höheres Einkommen als ein Schwellenwert $x$ besitzen, näherungsweise proportional zu $1 / x k$ ist, wobei der Parameter $k$ länderübergreifend etwa 1,5 beträgt. Diese Vorgabe definiert bis auf Skalierung die nach Pareto benannte Wahrscheinlichkeitsverteilung (über die kumulierte Verteilungsfunktion). Auch zahlreiche andere empirische Verteilungen lassen sich gut als Paretoverteilung beschreiben, zum Beispiel Stadtgrößen oder Schadenshöhen in der Versicherungsmathematik.^[1]

Definition

Pareto-Wahrscheinlichkeitsdichte f(x) mit (x_min=1).

Kumulative Verteilungsfunktion F(x)

Eine stetige Zufallsvariable $X$ heißt pareto-verteilt $\operatorname{Par}(k,x_{\min})$ mit den Parametern $k > 0$ und $x min > 0$ , wenn sie die Wahrscheinlichkeitsdichte

$f(x)= \begin{cases}\displaystyle \frac{k}{x_{\min}}\left(\frac{x_{\min}}{x}\right)^{k+1} & x\geq x_{\min} \\ 0 & x<x_{\min} \end{cases}$

besitzt.

$x min$ ist ein Parameter, der den Mindestwert der Verteilung beschreibt, welcher auch gleichzeitig das Maximum der Wahrscheinlichkeitsdichte ist (Modus). Mit steigendem Abstand zwischen $x$ und $x min$ sinkt die Wahrscheinlichkeit, dass $X$ den Wert $x$ annimmt. Der Abstand zwischen den beiden Werten wird als Quotient, das heißt als Verhältnis zwischen beiden Größen, bestimmt.

$k$ ist ein Parameter, der das Größenverhältnis der Zufallswerte in Abhängigkeit von ihrer Häufigkeit beschreibt. Mit $k$ wird der Quotient potenziert. Bei einem größeren $k$ verläuft die Kurve deutlich steiler, das heißt, die Zufallsvariable $X$ nimmt große Werte mit geringerer Wahrscheinlichkeit an.

Die Wahrscheinlichkeit, mit der die Zufallsvariable $X$ einen Wert kleiner oder gleich $x$ annimmt, errechnet sich damit mit der Verteilungsfunktion $F$ :

$P\left\{X \leq x\right\} = F(x) = \int_{x_{\min}}^{x} f(t) \, dt = 1-\left(\frac{x_{\min}}{x}\right)^{k},~~\forall x \geq x_{\min}$

Damit errechnet sich die Wahrscheinlichkeit, dass die Zufallsvariable $X$ Werte größer $x$ annimmt, durch:

${\rm P}\left\{X > x\right\} = 1-P\left\{X \leq x\right\} = \left(\frac{x_{\min}}{x}\right)^{k},~~\forall x \geq x_{\min}$

Eigenschaften

Erwartungswert

Der Erwartungswert ergibt sich zu:

$\operatorname{E}(X) = \begin{cases}\displaystyle x_{\min} \frac{k}{k-1} & k > 1\\ \infty & k \leq 1 \end{cases}$ .

Varianz

Die Varianz ergibt sich zu

$\operatorname{Var} (X) = \begin{cases}\displaystyle x_{\min}^2 \left( \frac{k}{k-2} - \frac{k^2}{(k-1)^2} \right) = x_{\min}^2 \frac{k}{(k-2)(k-1)^2} & k > 2 \\ \infty & k \leq 2 \end{cases}$ .

Standardabweichung

Aus der Varianz ergibt sich für $k > 2$ die Standardabweichung

$\sigma(X) = \frac{x_{\min}}{k-1} \sqrt{\frac{k}{k-2}}$ .

Variationskoeffizient

Aus Erwartungswert und Standardabweichung erhält man für $k > 2$ sofort den Variationskoeffizienten

$\operatorname{VarK}(X) = \frac{1}{\sqrt{k(k-2)}}$ .

Schiefe

Für die Schiefe erhält man für $k > 3$

$\operatorname{v}(X) = \frac{\displaystyle\frac{k}{k-3}-3\frac{k^2}{(k-2)(k-1)}+2\frac{k^3}{(k-1)^3}} {\displaystyle\left(\frac{k}{k-2}-\frac{k^2}{(k-1)^2}\right)^{\frac{3}{2}}} =\frac{2(1+k)}{k-3}\,\sqrt{\frac {k-2}2}$ .

Charakteristische Funktion

Die charakteristische Funktion ergibt sich zu: $k(-ix_\mathrm{min}t)^k\Gamma(-k,-ix_\mathrm{min}t)\,$ .

Dabei ist $Γ$ die Gammafunktion.

Momenterzeugende Funktion

Die momenterzeugende Funktion ist für die Pareto-Verteilung nicht in geschlossener Form angebbar.

Entropie

Die Entropie ergibt sich zu: $\log\left(\frac{k}{x_\mathrm{min}}\right) - \frac{1}{k} - 1\!$ .

Zipfsches Gesetz

Das Zipfsche Gesetz ist mathematisch mit der Pareto-Verteilung identisch (x- und y-Achse sind vertauscht). Während die Pareto-Verteilung die Wahrscheinlichkeit bestimmter Zufallswerte betrachtet, fokussiert das Zipfsche Gesetz die Wahrscheinlichkeit, mit der Zufallswerte eine bestimmte Position in der Rangfolge der Häufigkeit einnehmen.

Beziehung zur anderen Verteilungen

Beziehung zur Exponentialverteilung

Wenn $X$ eine Pareto-verteilte Zufallsvariable $\operatorname{Par}(k,1)$ mit den Parametern $k$ und $1$ ist, dann ist $log X$ exponentialverteilt $\operatorname{Exp}(k)$ mit dem Parameter $k$ .

Beziehung zur verschobenen Pareto-Verteilung

→ Hauptartikel: Verschobene Pareto-Verteilung

Wenn $X$ eine Pareto-verteilte Zufallsvariable ist, dann genügt $Y=\tfrac{1}{x_{\min}}\left(\tfrac{X}{x_{\min}}-1\right)$ einer verschobenen Pareto-Verteilung.

Ungleichverteilungsmaße und das Pareto-Prinzip

Lorenz-Kurve der Masse kleiner Städte und ihrer Einwohnerzahl. Die 80% kleinsten Städte stellen zusammen nur 38% der Gesamtbevölkerung. Der Theil-Index beträgt 0,8329315.

Da die (Wahrscheinlichkeitsdichte der) Pareto-Verteilung ein einzelnes Maximum beim kleinsten Wert $x m i n$ hat, weisen Pareto-verteilte Größen das aus dem Pareto-Prinzip (auch 80-zu-20-Regel) bekannte Phänomen der Ungleichverteilung auf: Kleinere Werte sind recht häufig, große Werte hingegen sehr selten. Wie stark dieser Effekt ausgeprägt ist, hängt vom Parameter $k$ ab.

Im Städte-Beispiel (s. Abbildung in der Einleitung) tragen wenige Großstädte überproportional zur Gesamtbevölkerung bei, während eine sehr große Zahl kleiner Städte nur wenige Einwohner stellt.

Zur Quantifizierung dieses Phänomens existieren verschiedene Ungleichverteilungsmaße. Für die Berechnung von Ungleichverteilungsmaßen beschreiben Verteilungen der Form „A zu B“ (A:B) zwei Quantile, wobei die Breite des ersten Quantils der Höhe des zweiten Quantils und die Höhe des ersten Quantils der Breite des zweiten Quantils gleicht. Ein Beispiel für diese Art, Verteilungen darzustellen ist das oft zitierte "80-20-Prinzip". Es gilt beispielsweise, wenn 80% einer Gruppe 20% der Ressourcen der Gruppe verfügen und 20% dieser Gruppe 80% der Ressourcen nutzen können.

In der Lorenz-Kurve stellt sich dieser Sachverhalt in der Gestalt eines „stehenden“ und eines „liegenden“ Quantils dar. $A$ und $B$ müssen dabei jeweils im Bereich von 0 bis 1 liegen und es gilt: $A + B = 1$ . Der Gini-Koeffizient und die Hoover-Ungleichverteilung sind in diesem Fall gleich:

$H=G=\left|2A-1 \right|=\left|2B-1 \right|$

Für eine 80:20-Verteilung ergibt sich somit ein Gini-Koeffizient bzw. ein Hoover-Koeffizient von 0,6 bzw. 60%.

$A:B = \left( \frac{1+H}{2} \right): \left( \frac{1-H}{2} \right)$

Für diese Zwei-Quantile-Verteilungen ist dann auch der Theil-Index (ein Entropie-Maß) einfach zu berechnen:

$T_T=T_L=T_s = 2 H \, \operatorname{artanh} \left( H \right)\,$

Das Paretoprinzip kann als Merkhilfe für den Wertebereich des Theil-Index dienen. Der Index hat bei einer Gleichverteilung von 0,5:0,5 (50 % zu 50 %) einen Wert von 0 und nimmt bei etwa 0,82:0,18 (82 % zu 18 %) den Wert 1 an^[2]. Das liegt ganz in der Nähe der Verteilung von 80% zu 20%. Oberhalb der Verteilung von 82% zu 18% ist der Theil-Index größer als 1.

Erkennen von Pareto-Verteilungen

Verteilung der Einwohnerzahl deutscher Städte und Gemeinden

Ob eine Verteilung eine Pareto-Verteilung ist, kann man grafisch anhand doppelt-logarithmischer Darstellungen der Verteilungen abschätzen.

Die Wahrscheinlichkeitsdichte der Pareto-Verteilung kann man als Power-Law/Potenzgesetz $y = a x b$ schreiben:

$f(x) = \frac{k}{x_{\min}}\left(\frac{x_{\min}}{x}\right)^{k+1} = ax^b \quad \text{mit}\quad a =k x_{\min}^k \text{ , } b=-(k+1)$

Auch ${\rm P}\left\{X > x\right\}$ kann man in die Form $a x b$ bringen:

${\rm P}\left\{X > x\right\} = \left(\frac{x_{\min}}{x}\right)^{k} = ax^b \quad \text{mit}a=x_{\min}^k \text{ , }\quad b=-k$

Der (einfach) logarithmierte Graph Y(x) solcher Potenzgesetze ist

$Y (x) = l o g (y) = l o g (a) + b * l o g (x)$

Nach logarithmieren der x-Achse mit $X = l o g (x)$ (d.h., der tatsächliche x-Wert beträgt $10 X$ , häufig wird die Achse jedoch direkt mit den x-Werten beschriftet) erhält man

$Y (X) = l o g (a) + b * X$

was eine Gerade mit Anstieg b ist.

Doppeltlogarithmische Darstellung der Verteilung

Im Diagramm links ist ${\rm P}\left\{X > x\right\}$ für das Städtebeispiel doppelt-logarithmisch dargestellt. Man erkennt gut, dass der Graph über weite Teile tatsächlich gerade verläuft, mit einem Anstieg $b\approx -1,31$ , woraus sich der Parameter $k=-b\approx 1,31$ ergibt.

Folglich lautet der Exponent der Dichtefunktion k+1 = 2,31, in guter Übereinstimmung mit der Literatur.

Für die Darstellung wurde ${\rm P}\left\{X > x\right\}$ verwendet, weil es ein kumulatives Maß ist, das durch Aufsummierung (in der Theorie: Integrieren) vieler Einzelwerte entsteht, wodurch die Streuung einzelner Werte weniger stark ins Gewicht fällt. Bei Verwendung des Histogramms hingegen ist eine Summierung vieler Werte nur mit einer verringerten Anzahl der Intervalle zu realisieren, wodurch die Verteilung unrealistisch grob würde.

Literatur

Rainer Schlittgen: Einführung in die Statistik. Oldenbourg Wissenschaftsverlag 2003, ISBN 3486274465, S. 231 (Auszug in der Google Buchsuche)
Karl Mosler, Friedrich Schmid: Wahrscheinlichkeitsrechnung und schließende Statistik. Springer 2006, ISBN 3540277870, S. 99 (Auszug in der Google Buchsuche)
Pareto, Vilfredo (1987): Cours d’Economie Politique

Weblinks

Commons: Pareto distribution – Sammlung von Bildern, Videos und Audiodateien

Benford’s law, Zipf’s law, and the Pareto distribution in Terence Taos Blog.
Universität Konstanz - Interaktive Animation
Die Pareto-Verteilung auf Neue Statistik

Einzelnachweise

↑ Michel Dekking: A modern introduction to probability and statistics: understanding why and how. Springer 2005, ISBN 1852338962, S. 63. (Auszug in der Google Buchsuche)
↑ On-Line-Rechner: Ungleichverteilung

Diskrete univariate Verteilungen

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Pareto-Verteilung — Pareto Verteilung, eine von V. Pareto empirisch abgeleitete Beziehung zwischen der Zahl der Einkommensbezieher mit einem Einkommen über einer bestimmten unteren Grenze und der Einkommenshöhe zur Kennzeichnung der personellen… … Universal-Lexikon
Verschobene Pareto-Verteilung — Die verschobene Pareto Verteilung ist eine in der mathematischen Statistik betrachtete Wahrscheinlichkeitsverteilung, die besonders zur Modellierung von Großschäden geeignet ist, insbesondere bei Industrie und Rückversicherungen.[1] Mathematisch… … Deutsch Wikipedia
Pareto — steht für: Vilfredo Pareto (1848−1923), italienischer Ingenieur, Ökonom und Soziologe Pareto Verteilung, eine von Vilfredo Pareto entwickelte Wahrscheinlichkeitsverteilung Paretoprinzip, auch Paretoeffekt oder 80/20 Regel Pareto Optimierung,… … Deutsch Wikipedia
Pareto — Pareto, Vilfredo, italienischer Volkswirtschaftler und Soziologe, * Paris 15. 7. 1848, ✝ Céligny (bei Genf) 19. 8. 1923; promovierter Ingenieur, 1870 90 (zuletzt als Generaldirektor) in der Eisenindustrie tätig, 1893 1911 Professor für… … Universal-Lexikon
Pareto-Regel — Die Pareto Verteilung, benannt nach dem italienischen Ingenieur, Soziologen und Ökonomen Vilfredo Pareto (1848–1923), ist eine stetige Wahrscheinlichkeitsverteilung. Inhaltsverzeichnis 1 Definition 2 Eigenschaften 2.1 Erwartungswert 2.2 Varianz … Deutsch Wikipedia
Pareto-Effekt — Das Paretoprinzip, auch Pareto Effekt, 80 zu 20 Regel, besagt, dass 80 % der Ergebnisse mit 20 % des Arbeitseinsatzes erreicht werden. Die verbleibenden 20 % verursachen die meiste Arbeit. Inhaltsverzeichnis 1 Ableitung 2 Beispiele 3 Literatur 4… … Deutsch Wikipedia
Pareto-Prinzip — Das Paretoprinzip, auch Pareto Effekt, 80 zu 20 Regel, besagt, dass 80 % der Ergebnisse mit 20 % des Arbeitseinsatzes erreicht werden. Die verbleibenden 20 % verursachen die meiste Arbeit. Inhaltsverzeichnis 1 Ableitung 2 Beispiele 3 Literatur 4… … Deutsch Wikipedia
Pareto-Effizienz — In der Mathematik und im Operations Research bezeichnet man mit Pareto Optimierung (nach Vilfredo Pareto; auch mehrkriterielle Optimierung oder multikriterielle Optimierung) das Lösen eines Optimierungsproblems mit mehreren Zielen, also eines… … Deutsch Wikipedia
Pareto-Optimalität — In der Mathematik und im Operations Research bezeichnet man mit Pareto Optimierung (nach Vilfredo Pareto; auch mehrkriterielle Optimierung oder multikriterielle Optimierung) das Lösen eines Optimierungsproblems mit mehreren Zielen, also eines… … Deutsch Wikipedia
Pareto-effizient — In der Mathematik und im Operations Research bezeichnet man mit Pareto Optimierung (nach Vilfredo Pareto; auch mehrkriterielle Optimierung oder multikriterielle Optimierung) das Lösen eines Optimierungsproblems mit mehreren Zielen, also eines… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Pareto-Verteilung

Inhaltsverzeichnis

Begriffsgeschichte

Definition