Median


Median

Der Median (oder Zentralwert) ist ein Lageparameter von Verteilungen, also Häufigkeitsverteilungen, Stichproben oder Wahrscheinlichkeitsverteilungen. Ursprünglich ist Median ein Begriff der Geometrie, wo er eine Grenze zwischen zwei Hälften gleicher Größe bezeichnet. In der Statistik teilt der Median beispielsweise eine Grundgesamtheit in zwei Hälften gleicher Größe, so dass Merkmalsausprägungen in der einen Hälfte kleiner als der Medianwert sind, in der anderen größer. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein und sich auch auf ordinal skalierte Variablen anwenden zu lassen. Der Median gehört zur Gruppe der Quantile und kann auch als 0,5-Quantil bezeichnet werden.

Inhaltsverzeichnis

Median einer Stichprobe

Ein Wert m ist Median einer Stichprobe, wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert < m und höchstens die Hälfte einen Wert > m hat.

Sortiert man die Beobachtungswerte der Größe nach, das heißt geht man zur nach Rang geordneten Stichprobe über, so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser Folge liegenden Beobachtung. Bei einer geraden Anzahl von Beobachtungen gibt es kein einziges mittleres Element, sondern zwei. Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen (obwohl diese möglicherweise bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.

Bei kardinal skalierten Messgrößen (wenn es also sinnvoll möglich ist, die Differenz von Messwerten zu berechnen) verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte. Der Median \tilde x einer geordneten Stichprobe (x_1, x_2, \dots, x_n) von n Messwerten ist dann also

\begin{align}\tilde x 
&=\begin{cases}
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
  \frac 12\left(x_{\frac n2} + x_{\frac n2 + 1}\right) & n \text{ gerade.}
\end{cases}\\
&= \tfrac 12\left(x_{\lceil{\frac n2}\rceil} + x_{\lfloor{\frac n2 + 1}\rfloor}\right) &= \tfrac 12\left(\tilde x_u + \tilde x_o\right)
\end{align}

Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian \tilde x_u = x_\frac{n}{2} oder der Obermedian \tilde x_o = x_{\frac{n}{2}+1} genutzt und als Median bezeichnet.

Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei SELECT-Abfragen mittels des Medians der Mediane.

Eigenschaften

Der Median \tilde x, und im Fall einer geraden Anzahl von Messwerten alle Werte \tilde x mit \tilde{x}_u \le \tilde x \le \tilde{x}_o, minimieren die Summe der absoluten Abweichungen, das heißt für ein beliebiges x gilt

\sum_{i=1}^n |\tilde x - x_i| \le \sum_{i=1}^n |x - x_i|.

Der Median ist Grundlage der Methode der kleinsten absoluten Abweichungen und Verfahren der robusten Regression. Das arithmetischen Mittel dagegen minimiert die Summe der quadratischen Abweichungen und ist Grundlage der Methode der kleinsten Quadrate und der Regressionsanalyse und ist mathematisch leichter zu handhaben, jedoch nicht robust gegen Ausreißer.

Der Median könnte algorithmisch bestimmt werden, indem die Messwerte sortiert werden. Da dies mit Aufwand \mathcal{O}\left( n \log n\right) verbunden ist, wird zu im Allgemeinen zu speziellen Algorithmen zur Quantilsbestimmung mit linearem Aufwand \mathcal{O}\left( n \right) gegriffen oder zu Abschätzungen wie der Cornish-Fisher-Methode. Das arithmetische Mittel lässt sich ebenfalls in linearer Zeit bestimmten.

Beispiele

  • Messwerte 1, 2, 4, 5, 18: ungerade Anzahl. Der Median (auch der Ober- und der Untermedian) ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel ist 6.
  • Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Obermedian ist 3, der Untermedian ist 2. Das arithmetische Mittel ist 8.
  • Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Der Ober- und der Untermedian sind ebenfalls 3. Das arithmetische Mittel ist 2,5.

Median einer Verteilung

Dichtefunktion einer Dreiecksverteilung mit Median

Eine Verallgemeinerung des Begriffes liefert die stochastische Betrachtung einer reellwertigen Zufallsvariable X und ihrer Verteilung, beziehungsweise ihrer Verteilungsfunktion F. Dort ist der Median das 0,5-Quantil, also

\inf\left\{x\in\R:F(x) \ge \frac 12\right\}.

Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten Obermedian.

Er ist, neben beispielsweise Erwartungswert und Modus, ein Lageparameter.

Zwischen Erwartungswert μ, Median m und Standardabweichung σ besteht ein allgemeiner Zusammenhang durch die Tschebyschow-Ungleichung der Form

   \left|\mu-m\right| \leq \sigma.

Beispiel

Bei der Dreiecksverteilung

f(x) = \frac x{18},\quad 0 \le x \le 6,

ist der Median der x-Wert, welcher die Fläche

F(x)=\frac 12\cdot x\cdot\frac{x}{18}

unter der Dichtefunktion in zwei gleich große Flächen teilt. Dieser Wert wird somit durch die Gleichung

F(m)=\frac 12\cdot m\cdot\frac{m}{18}=\frac 12

bestimmt. Für deren Lösung m=\sqrt{18}\approx 4{,}24 gilt damit P(X \le 4{,}24) \approx 0{,}5.

D. h. in diesem Beispiel ist der Median m nicht identisch mit dem Erwartungswert E(X) = 4.

Median von gruppierten Daten

Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.

Es seien n die Anzahl aller Daten, ni die jeweilige Anzahl der Daten der i-ten Gruppe und ui bzw. oi die entsprechenden oberen bzw. unteren Intervallgrenzen.

Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d. h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z. B. die m-te Gruppe. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z. B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:

x_\mathrm{med} = u_m+\frac{\frac n2 - \sum\limits_{k=1}^{m-1}n_k}{n_m} \cdot (o_m-u_m).

Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.

Beispiel

Einkommen:

Klasse (i) Bereich (ui bis oi) Gruppengröße (ni)
1 mind. 0, weniger als 1500 160
2 mind. 1500, weniger als 2500 320
3 mind. 2500, weniger als 3500 212

Man berechne

\tfrac n2 = \tfrac{212+320+160}2 = \tfrac{692}2=346.

Also liegt der Median in der 2. Klasse (d. h. m = 2), da die erste Klasse nur 160 Elemente umfasst. Somit ergibt sich als Schätzung für den Median

x_\mathrm{med} = 1500 + \tfrac{346-160}{320}\cdot (2500-1500) = 2081{,}25.

Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abszissenwert x_\mathrm{med}\, gesucht, der zum Ordinatenwert \tfrac{n}{2} gehört. Bei kleinerem und geradem n kann auch stattdessen der Ordinatenwert \tfrac{n}{2}+1 gewählt werden.

Vor- und Nachteile des Medians

Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten, wie sie beispielsweise auf nach oben offenen Skalen positiver Zahlen vorkommen. Gegebenenfalls hat die Kurve am linken Ende der Verteilung bei ≥ 0 eine Nullstelle, während das rechte Ende einen asymptotenähnlichen Verlauf nimmt.

Dieser Vorteil verkehrt sich jedoch in einen Nachteil, wenn die Verteilung der Daten z.B. bimodal, ist.

Beispiel 1

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 9 Personen verdienen jeweils EUR 1.000 und
  • 1 Person verdient EUR 1.000.000.

Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000. Der Median wäre für diese Daten eine bessere Maßzahl.

Beispiel 2

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 6 Personen verdienen jeweils EUR 1.000 und
  • 4 Personen verdienen jeweils EUR 2.000.

Der Median beträgt nur EUR 1.000 EUR, das Durchschnittseinkommen 1.400 EUR. Das arithmetische Mittel wäre für diese Daten eine bessere Maßzahl.

Alternativen

Eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung ist die von Amartya Sen vorgeschlagene Wohlfahrtsfunktion.

Siehe auch

Weblinks

Wiktionary Wiktionary: Median – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wikimedia Foundation.

Synonyme:

Schlagen Sie auch in anderen Wörterbüchern nach:

  • médian — médian, iane [ medjɑ̃, jan ] adj. et n. f. • 1550 « demi »; médiantXIVe; lat. medianus I ♦ Adj. (1560 anat.; autres emplois 1812) 1 ♦ Qui est situé, placé au milieu. Ligne médiane, plan médian. Anat. Veines, artères médianes. Vermis médian.… …   Encyclopédie Universelle

  • median — me‧di‧an [ˈmiːdiən] adjective [only before a noun] STATISTICS the median number is the middle one in a series of numbers, arranged in order: • The median sales price fell 1.4% from October. • Median household income fell by 1.9% last year. see… …   Financial and business terms

  • median — MEDIÁN, Ă, mediani, e, adj. Care se află la mijloc; medial. ♦ Situat la mijlocul unei figuri geometrice. ♦ (Substantivat, f.) Fiecare dintre dreptele care unesc un vârf al unui triunghi cu mijlocul laturii opuse vârfului. ♦ (Substantivat, f.)… …   Dicționar Român

  • Median — Me di*an (m[=e] d[i^]*an), a. [L. medianus, fr. medius middle. See {Medial}.] 1. Being in the middle; running through the middle; as, a median groove. [1913 Webster] 2. (Zo[ o]l.) Situated in the middle; lying in a plane dividing a bilateral… …   The Collaborative International Dictionary of English

  • Median — Mediān, ein aus dem Lat. medianus entlehntes und nur in einigen Zusammensetzungen übliches Wort, etwas zu bezeichnen, welches theils in der Mitte zwischen andern Dingen, theils aber auch von mittlern Größe ist, d.i. zwar größer als gewöhnlich,… …   Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart

  • médian — médian, ane (mé di an, a n ) adj. 1°   Terme d anatomie. Qui est au milieu.    Ligne médiane, ligne verticale qu on suppose partager longitudinalement le corps en deux parties égales et symétriques.    Veines médianes, nom donné à trois veines… …   Dictionnaire de la Langue Française d'Émile Littré

  • median — index average (midmost), central (situated near center), intermediate, mesne, norm Burton s Legal Thesaurus. William C. Burton. 2006 …   Law dictionary

  • median — [mē′dē ən] adj. [L medianus < medius, middle: see MID1] 1. middle; intermediate a) designating a line extending from a vertex of a triangle to the middle of the opposite side b) designating a line joining the midpoints of the nonparallel sides …   English World dictionary

  • Median — Me di*an, n. (Geom.) A median line or point. [1913 Webster] …   The Collaborative International Dictionary of English

  • median# — median n *average, mean, norm, par median adj average, mean, par (see under AVERAGE n) …   New Dictionary of Synonyms

  • median — ► ADJECTIVE 1) technical situated in the middle. 2) referring to the middle term (or mean of the middle two terms) of a series of values arranged in order of magnitude. ► NOUN 1) a median value. 2) Geometry a straight line drawn from one of the… …   English terms dictionary