Klasseneinteilung (Statistik)

Klasseneinteilung (Statistik)

Klasseneinteilung oder Klassierung bezeichnet in der Statistik die Einteilung von Merkmalswerten bzw. statistischen Reihen in disjunkte Gruppen, die sogenannten Klassen. Jedes Element der untersuchten Gesamtheit wird in Abhängigkeit von seinem Wert auf der entsprechenden Variablen genau einer Klasse zugeordnet. Die Klasseneinteilung wird erforderlich, wenn die Anzahl der verschiedenen Werte der beobachteten Zufallsvariablen zu groß ist, um praktikabel verarbeitet bzw. dargestellt werden zu können, wenn zu erwarten ist, dass die erhobenen Werte nur als Näherung der wahren Werte angesehen werden können oder wenn (quasi-)stetige Variablen mit Methoden für diskrete Variablen untersucht werden sollen.

Die Werte einer Klasse liegen alle innerhalb der oberen und unteren Klassengrenze. Die Klassenbreite bezeichnet die Differenz aus beiden Klassengrenzen. Die Klassenmitte stellt den zur weiteren Analyse genutzten repräsentativen Wert einer Klasse dar. Die Klassenhäufigkeit oder Besetzungszahl[1] entspricht der Anzahl der in der Klasse enthaltenen Elemente.

Inhaltsverzeichnis

Klasse und Klassierung

Klassen sind disjunkte, d.h. nicht überlappende, aneinander grenzende Intervalle von Merkmalswerten, die durch eine untere und eine obere Klassengrenze begrenzt und eindeutig festgelegt sind.

Eine Klassierung ist eine Zusammenfassung von gleichen oder ähnlichen Merkmalsausprägungen (z.B. des Merkmals "Nettoeinkommen") zu einer Gruppe bzw. Klasse. Da es bei statistischen Untersuchungen oft nicht möglich oder sinnvoll ist, alle einzelnen (verschiedenen) Merkmalsausprägungen bzw. Realisationen der untersuchten Zufallsvariablen zu erheben oder zu verarbeiten, kann durch eine Klassierung eine bessere Übersicht über die Daten erreicht werden. Das trifft insbesondere auf stetige oder quasi-stetige Merkmale oder auf Merkmale, deren Anzahl von (unterschiedlichen) Merkmalsausprägungen sehr groß ist, zu.

Nachteil der Klassierung ist der Informationsverlust, der dadurch entsteht, dass die einzelnen Beobachtungswerte durch alleinige Betrachtung der Klassen "verlorengehen" und stattdessen nur repräsentative Größen wie die Anzahl der in einer bestimmten Klasse enthaltenen Beobachtungen oder die Klassenmitte für weitere Analysen zur Verfügung stehen.

Innerhalb einer Klasse sollten die Beobachtungen auf die Merkmalsausprägungen möglichst gleichverteilt sein, d.h. die Ausprägungen sollten sich beispielsweise nicht nur im unteren Bereich der Klasse häufen, damit die Klasse bzw. die Klassenbreite für die enthaltenen Beobachtungen repräsentativ ist.

Klassengrenze

Eine Klassengrenze ist derjenige Wert einer metrisch skalierten (Zufalls-)Variablen, der eine Klasse nach unten bzw. oben begrenzt. Eine Klasse j\, wird dabei durch zwei Klassengrenzen definiert, die untere Klassengrenze x_{j}^{u} und die obere Klassengrenze x_{j}^{o} (j=1,...,k)\,, wobei die obere Klassengrenze der j\,-ten Klasse der unteren Klassengrenze der (j+1)\,-ten Klasse entspricht, d.h.

x_{j}^{o} = x_{j+1}^{u},\quad j=1,\ldots,k-1.

Die Zuordnung der Klassengrenzen zu einer Klasse kann auf zwei Arten erfolgen. Entweder gehört die untere Klassengrenze x_{j}^{u} zur Klasse j\, und die obere Klassengrenze x_{j}^{o} zur Klasse j+1\, oder die untere Klassengrenze x_{j}^{u} gehört zur Klasse j-1\, und die obere Klassengrenze x_{j}^{o} zur Klasse j\,, d.h.

x_{j}^{u} < x \leq x_{j}^{o} oder x_{j}^{u} \leq x < x_{j}^{o},\quad j=1,\ldots,k.

Das folgende Beispiel illustriert die beiden Alternativen der Klasseneinteilung:

Alternative 1 Alternative 2
< 100 <= 100
>= 100 bis < 120 > 100 bis <= 120
>= 120 bis < 150 > 120 bis <= 150
>= 150 > 150

Ein Beobachtungswert bzw. eine untersuchte statistische Einheit x_{i}\, (i=1,\dots,n) wird also Klasse j\, zugeordnet, falls  x_{j}^{u}\leq x_{i}<x_{j}^{o} oder x_{j}^{u} < x \leq x_{j}^{o},\; j=1,\ldots,k,  gilt.

Klassenbreite

Die Klassenbreite ist die Differenz aus oberer und unterer Klassengrenze:

\Delta x_{j} = x_{j}^{o} - x_{j}^{u},\quad j=1,\ldots,k .

Dabei können die Klassen eines Merkmals auch verschiedene Breiten aufweisen. Die optimale Anzahl der Klassen bzw. die Breite der Klassen hängt von der konkreten Untersuchungsituation (Daten, Ziele,...) ab. Einige "Faustregeln" zur Bestimmung der Anzahl der Klassen bzw. der Klassenbreite finden sich im Artikel zum Histogramm. Der Jenks-Caspall-Algorithmus stellt ein Verfahren zur automatischen Klassierung bereit.

Klassenmitte

Nach der Klassierung kann für weitere Analysen die Klassenmitte x_{j}\, als repräsentativer Wert einer Klasse j\, genutzt werden. Sie kann bei symmetrischer Verteilung der Elemente einer Klasse auf die enthaltenen Ausprägungen bzw. Werte in der jeweiligen Klasse als arithmetisches Mittel aus unterer und oberer Klassengrenze ermittelt werden:

x_{j} = \frac{{ x_{j}^{u} + x_{j}^{o}}}{2},\quad j=1,\ldots,k

Häufigkeitsdichte

Als Beispiel wird das metrisch stetige Merkmal "Nettojahreseinkommen" einer wohldefinierten Grundgesamtheit untersucht. Da die Anzahl der Personen mit steigendem Einkommen geringer wird, wählt man i.d.R. die oberen Einkommensklassen breiter als die mittleren und unteren, damit die Darstellung übersichtlich bleibt.

Wird ein Merkmal in unterschiedlich breite Klassen eingeteilt, ist die (absolute bzw. relative) Klassenhäufigkeit jedoch ohne Angabe der Klassenbreite wenig aussagekräftig. Daher ist die Berechnung der Häufigkeitsdichte wichtig, um die Klassen vergleichbar zu machen. Sie entspricht der zur Klassenbreite und Klassenhäufigkeit gehörenden Säulenhöhe in einem Histogramm.

Die Häufigkeitsdichte einer Klasse ist das Verhältnis der absoluten oder der relativen Häufigkeit einer Klasse zur entsprechenden Klassenbreite.


Die Häufigkeitsdichte für  x_{j}^{u}\leq X < x_{j}^{o}   ergibt sich damit wie folgt:


 \widehat{h}\left(  x_{j}\right) = \frac{h\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}}  mit h\left(x_{j}\right) die absolute Häufigkeit von Klasse j\,

oder

 \widehat{f}\left(  x_{j}\right) = \frac{f\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}} mit f\left(  x_{j}\right) die relative Häufigkeit von Klasse j\,.

Darstellung klassierter Variablen

Eine Möglichkeit der systematischen und übersichtlichen Darstellung einer klassierten stetigen Zufallsvariablen bietet eine Häufigkeitstabelle:

Merkmalsklassen

 x_{j}^{u}\leq X<x_{j}^{o}

absolute Häufigkeit

 h(x_{j})\,

relative Häufigkeit

 f(x_{j})\,

 x_{1}^{u}- x_{1}^{o}  h\left( x_{1}\right)  f\left( x_{1}\right)
 x_{2}^{u}-x_{2}^{o}  h\left(x_{2}\right)  f\left( x_{2}\right)
 \vdots  \vdots  \vdots
 x_{j}^{u}-x_{j}^{o}  h\left(x_{j}\right)  f\left( x_{j}\right)
 \vdots  \vdots  \vdots
 x_{k}^{u}-x_{k}^{o}  h\left(x_{k}\right)  f\left( x_{k}\right)
Summe n\, 1

wobei n\, die Anzahl der Untersuchungsobjekte ist.

Für die Darstellung mehrdimensionaler Häufigkeitsverteilungen können Kreuztabellen genutzt werden.

Die grafische Darstellung klassierter Variablen kann z.B. über ein Histogramm, ein Säulen- bzw. Stabdiagramm, ein Balkendiagramm oder bei sehr wenigen Klassen über ein Tortendiagramm erfolgen.

Einzelnachweise

  1. Günter Bamberg, Franz Baur, Michael Krapp: Statistik. 14. Auflage. Oldenbourg, 2008, S. 14.

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Klasseneinteilung — steht für: Klasseneinteilung (Statistik), die Einteilung von Merkmalswerten einer Stichprobe Klasseneinteilung (Reitsport), das Ordnungssystem im Reitsport Partition (Mengenlehre), die Zerlegung einer Menge in disjunkte Teilmengen …   Deutsch Wikipedia

  • Kumulative Häufigkeit — Die kumulierte Häufigkeit oder Summenhäufigkeit ist ein Maß der deskriptiven Statistik. Sie gibt an, bei welcher Anzahl der Merkmalsträger in einer empirischen Untersuchung die Merkmalsausprägung kleiner ist als eine bestimmte Schranke. Die… …   Deutsch Wikipedia

  • Summenhäufigkeit — Die kumulierte Häufigkeit oder Summenhäufigkeit ist ein Maß der deskriptiven Statistik. Sie gibt an, bei welcher Anzahl der Merkmalsträger in einer empirischen Untersuchung die Merkmalsausprägung kleiner ist als eine bestimmte Schranke. Die… …   Deutsch Wikipedia

  • Klasse — (v. lat. classis „Herbeirufung“, „herbeigerufene Volksmasse“, „Flotte“) steht für: Klasse (Soziologie), Gruppierung der Bevölkerung nach ökonomischen und sozialen Merkmalen Klasse (Biologie), Gruppe von Lebewesen mit gemeinsamen Eigenschaften… …   Deutsch Wikipedia

  • Klassieren — (zu Klasse ‚sortierte Gruppe‘) ist das Einsortieren von Objekten in eine bestehende Klassifikation; Beispiele sind: Klassieren (Verfahrenstechnik), das Trennen von Stoffgemischen Klasseneinteilung (Statistik), Einteilung statistischer Merkmale in …   Deutsch Wikipedia

  • Fußball im Burgenland — Dieser Artikel soll einen Überblick über das Fußballgeschehen im Burgenland geben. Der offizielle Spielbetrieb wird vom Burgenländischen Fußballverband organisiert. In der Saison 2010/11 nehmen 171 Vereine am Spielbetrieb teil. Inhaltsverzeichnis …   Deutsch Wikipedia

  • DIN EN — Logo des DIN Deutschen Instituts für Normung Die Liste gibt einen Überblick über das Benennungssystem der DIN Normen mit Normnummer, Teile von Normen und anderen Zusätzen. Außerdem werden hier Informationen über Normen, ihren Titel sowie über… …   Deutsch Wikipedia

  • DIN EN ISO — Logo des DIN Deutschen Instituts für Normung Die Liste gibt einen Überblick über das Benennungssystem der DIN Normen mit Normnummer, Teile von Normen und anderen Zusätzen. Außerdem werden hier Informationen über Normen, ihren Titel sowie über… …   Deutsch Wikipedia

  • DIN EN ISO/IEC — Logo des DIN Deutschen Instituts für Normung Die Liste gibt einen Überblick über das Benennungssystem der DIN Normen mit Normnummer, Teile von Normen und anderen Zusätzen. Außerdem werden hier Informationen über Normen, ihren Titel sowie über… …   Deutsch Wikipedia

  • DIN EN ISP — Logo des DIN Deutschen Instituts für Normung Die Liste gibt einen Überblick über das Benennungssystem der DIN Normen mit Normnummer, Teile von Normen und anderen Zusätzen. Außerdem werden hier Informationen über Normen, ihren Titel sowie über… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”