Schiefe (Statistik)


Schiefe (Statistik)

Die Schiefe (Englischer Fachausdruck: Skew bzw. Skewness) beschreibt die „Neigungsstärke“ einer statistischen Verteilung X. Sie zeigt an, ob und wie stark die Verteilung nach rechts (positive Schiefe) oder nach links (negative Schiefe) geneigt ist. Jede nicht symmetrische Verteilung heißt schief.[1][2][3]

Inhaltsverzeichnis

Definition

Rechtsschief.svg Linksschief.svg

In der Statistik ist die Schiefe \operatorname{v}(X) einer Zufallsvariablen X das auf die dritte Potenz der Standardabweichung bezogene zentrale Moment 3. Ordnung μ3(X):

\operatorname{v}(X) := \frac{\mu_3(X)}{\sigma^3(X)}=\frac{\operatorname{E}\left((X-\operatorname{E}(X))^3\right)}{\operatorname{Var}(X)^{\frac{3}{2}}} = \frac{\operatorname{E}\left(X^3\right)-3\operatorname{Var}(X)\operatorname{E}(X)-\operatorname{E}(X)^3}{\operatorname{Var}(X)^{\frac{3}{2}}}.

mit dem Erwartungswert \operatorname{E}(X) und der Varianz \operatorname{Var}(X).

Die Schiefe ist invariant unter linearer Transformation mit a > 0:

\operatorname{v}(aX+b)=\operatorname{v}(X)

Empirische Schiefe

Zur Berechnung der Schiefe einer empirischen Häufigkeitsverteilung müssen der Erwartungswert und die Varianz geschätzt werden, d.h. die theoretischen durch die empirischen Momente ersetzt werden:

v = \frac1n \sum_{i=1}^n \left(\frac{x_i-\bar{x}}{s}\right)^3

mit n der Stichprobenumfang (Anzahl der Beobachtungen), xi die i-te Beobachtung, \bar{x} der Stichprobenmittelwert und s die Stichprobenstandardabweichung. Dieser Schätzer ist jedoch nicht erwartungstreu im Gegensatz zu

v' = \frac{n}{(n-1)(n-2)} \sum_{i=1}^n \left(\frac{x_i-\bar{x}}{s}\right)^3.

Deutung

Beispiel von experimentellen Daten mit einer positiven Schiefe

Ist \operatorname{v}>0, so ist die Verteilung rechtsschief, ist \operatorname{v}<0, ist die Verteilung linksschief (auch genannt rechtssteil). Bei rechtsschiefen (oder linkssteilen) Verteilungen sind Werte, die kleiner sind als der Mittelwert, häufiger zu beobachten, so dass sich der Gipfel (Modus) links vom Mittelwert befindet; der rechte Teil des Graphs ist flacher als der linke. Gilt \operatorname{v}=0, so ist die Verteilung auf beiden Seiten ausgeglichen. Bei symmetrischen Verteilungen ist immer \operatorname{v}=0. Umgekehrt müssen Verteilungen mit \operatorname{v}=0 nicht streng symmetrisch sein.

Die Schiefe ist ein Maß für die Asymmetrie einer Wahrscheinlichkeitsverteilung zum Mittelwert. Da die Gaußsche Normalverteilung symmetrisch ist, d.h. eine Schiefe von Null besitzt, ist die Schiefe eine mögliche Maßzahl, um eine Verteilung mit der Normalverteilung zu vergleichen. (Für einen Test dieser Eigenschaft siehe z. B. den Kolmogorow-Smirnow-Test.)

Nicht nur die Normalverteilung weist eine Schiefe von Null auf. Auch beliebige andere in Bezug auf den Mittelwert gänzlich symmetrische Verteilungen weisen eine Schiefe von Null auf. Ein Beispiel stellt eine bimodale und symmetrische Verteilung dar.

Interpretation der Schiefe

Rechtsschiefe Verteilungen findet man z. B. häufig beim Pro-Kopf-Einkommen. Hier gibt es einige wenige Personen mit extrem hohem Einkommen und sehr viele Personen mit eher niedrigem Einkommen. Durch die 3. Potenz erhalten die wenigen sehr extremen Werte ein hohes Gewicht und es entsteht ein Schiefemaß mit positivem Vorzeichen. Es gibt verschiedene Formeln, um die Schiefe zu berechnen. Die gängigen Statistikpakete wie SPSS, SYSTAT, Stata etc. nutzen besonders im Falle einer kleinen Fallzahl von obiger, momentbasierter Berechnungsvorschrift abweichende Formeln.

Siehe auch

Literatur

  • W. H. Press et al.: Numerical Recipes in C. 2. Auflage. Cambridge University Press, 1992, Kapitel 14.1.

Einzelnachweise

  1. Universität Bielefeld: Andreas Handl - Symmetrie und Schiefe , Seite 4
  2. "Statistik für Wirtschafts- und Sozialwissenschaften. Deskriptive Statistik" von Peter Pflaumer, Barbara Heine, Joachim Hartung , Seite 48
  3. "SPSS 16" von Felix Brosius, Seite 361

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Schiefe — steht für: Schiefe (Statistik), die Abweichung einer statistischen Verteilung von einer zum Mittelwert symmetrischen Verteilung Natürliche Schiefe, das Maß, zur Links oder Rechts„händigkeit“ eines Tieres schief bezieht sich auch auf: Schiefe… …   Deutsch Wikipedia

  • Schiefe der Ekliptik — Ekliptik mit vier Sonnenörtern und Himmelskoordinaten Die Ekliptik ist die Projektion der scheinbaren Bahn der Sonne im Verlauf eines Jahres auf die Himmelskugel, d.h. den Fixsternhintergrund. Die Ekliptik ist ein imaginärer Großkreis am Himmel,… …   Deutsch Wikipedia

  • Schiefe Bahn — Der Begriff der Kriminalität (von lat. crimen „Beschuldigung, Anklage, Schuld, Verbrechen“) orientiert sich im Wesentlichen an der juristischen Definition der Straftat. Während sich die „Straftat“ oder der materielle Verbrechensbegriff jedoch… …   Deutsch Wikipedia

  • Schiefe — in der Statistik Bezeichnung für die Eigenschaft einer ⇡ Verteilung (⇡ Häufigkeitsverteilung, ⇡ Wahrscheinlichkeitsfunktion, ⇡ Dichtefunktion), asymmetrisch zu sein. Man unterscheidet linkssteile (rechtsschiefe) und rechtssteile (linksschiefe)… …   Lexikon der Economics

  • Poisson Statistik — Die Poisson Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, die beim mehrmaligen Durchführen eines Bernoulli Experiments entsteht. Letzteres ist ein Zufallsexperiment, das nur zwei mögliche Ergebnisse besitzt (z. B. „Erfolg“ und… …   Deutsch Wikipedia

  • Beschreibende Statistik — Die deskriptive oder beschreibende Statistik ist der Zweig der Statistik, in dem alle Techniken zusammengefasst werden, die eine Menge von beobachteten Daten summarisch darstellen. Von der induktiven oder inferentiellen Statistik… …   Deutsch Wikipedia

  • Exzess (Statistik) — Die Wölbung (auch Kurtosis oder Exzess) einer statistischen Verteilung X ist definiert als normierte Form des vierten zentralen Moments μ4(X). Sie beschreibt die „Spitzigkeit“ der Wahrscheinlichkeitsdichtefunktion. Die Wölbung gibt es in… …   Deutsch Wikipedia

  • Wölbung (Statistik) — Die Wölbung oder Kurtosis (griechisch κύρτωσης kyrtōsis‚ das Krümmen, Wölben) ist eine Maßzahl für die Steilheit bzw. „Spitzigkeit“ einer (eingipfligen) Wahrscheinlichkeitsfunktion, statistischen Dichtefunktion oder Häufigkeitsverteilung.[1] …   Deutsch Wikipedia

  • Modus (Statistik) — Der Modus xD oder Modalwert ist bei einer empirischen Häufigkeitsverteilung der häufigste Wert, bei einer diskreten Zufallsvariable die Ausprägung mit der größten Wahrscheinlichkeit und bei einer stetigen Zufallsvariable die Maximumstelle der… …   Deutsch Wikipedia

  • Deskriptive Statistik — Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, empirische Daten durch Tabellen, Kennzahlen (auch: Maßzahlen oder Parameter) und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem bei umfangreichem Datenmaterial… …   Deutsch Wikipedia