Scatterplot

Scatterplot
Beispiel eines Streudiagramms, in dem die Länge und Breite von verschiedenen Artillerieschiffen dargestellt ist

Ein Streudiagramm (engl. Scatterplot) ist die graphische Darstellung von beobachteten Wertepaaren zweier statistischer Merkmale. Diese Wertepaare werden in ein kartesisches Koordinatensystem eingetragen, wodurch sich eine Punktwolke ergibt. Die Darstellung der Punkte kann durch verschiedene kleine Symbole erfolgen.

Anwendung

Man erhofft sich durch das Muster der Punkte im Streudiagramm Informationen über die Abhängigkeitsstruktur der beiden Merkmale, die durch die Koordinaten repräsentiert sind.

Nebenstehendes Beispieldiagramm enthält Punkte, die die beiden Merkmale "Länge" und "Breite" von verschiedenen Artillerieschiffen darstellen. Die Schiffe sind in vier Klassen eingeteilt, denen unterschiedliche Farben zugewiesen sind (Zerstörer, leichter Kreuzer, schwerer Kreuzer, Schlachtschiff). Man erkennt durch ein solches Streudiagramm auf einen Blick verschiedene Korrelationen in den erfassten Daten.

Häufig auftretende Korrelationen sind Cluster (Ballungen) und lineare Strukturen. Cluster können mit der Clusteranalyse untersucht werden. Zur Quantifizierung von linearen Korrelationen bietet sich vor allem die Regressionsanalyse an.

Falls ein drittes (metrisches) Merkmal auch noch mit dargestellt werden soll, kann das durch die Größe der Punkte (bzw. Kreise) geschehen. Den dabei entstehenden Diagrammtyp nennt man Blasendiagramm.

Streudiagramme bei ordinalskalierten Merkmalen

Es sind im allgemeinen nur stetig verteilte Daten für Streudiagramme geeignet. Beobachtungen diskret verteilter Merkmale überlagern sich, wenn gleiche Werte mehrfach vorliegen. Es gibt jedoch auch Möglichkeiten, ordinalskalierte Merkmale in Streudiagramme darzustellen:

  • Durch "Sonnenblumen": Es wird an jedem Koordinatenpaar ein Kreis eingetragen. Die Zahl der Wertepaare, die auf diesem Punkt liegen, wird durch Striche an den Kreis dargestellt, so dass sich eine stilisierte Sonnenblume ergibt.
  • Durch einen "Jittered Scatterplot" ("Verwackeltes Streudiagramm"): Es werden auf die Daten kleine Zufallszahlen addiert, so dass die Werte leicht auseinander gezogen werden und eine Punktwolke ergeben. Man muss sich allerdings im Klaren sein, dass die Werte eigentlich übereinanderliegen. Man könnte sie als "pseudometrisch" bezeichnen.

Das folgende Beispiel zeigt beide Möglichkeiten anhand der Evaluation einer Statistik-Vorlesung, bei der die Merkmale "Stoff ist verständlich" und "Gesamtnote Statistik" (Noten von 1 bis 4) in ein Streudiagramm eingetragen wurden.

Beispiel: Sonnenblumen-Streudiagramm

Beispiel: Jittered scatter plot


Siehe auch


Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Scatterplot — A scatter graph or scatter plot is a type of display using Cartesian coordinates to display values for two variables for a set of data. The data is displayed as a collection of points, each having the value of one variable determining the… …   Wikipedia

  • scatterplot — scat·ter·plot (skatґər plot) a plot in rectangular coordinates of paired observations of two random variables, each observation plotted as one point on the graph; the scatter or clustering of points provides an indication of the relationship …   Medical dictionary

  • scatterplot — ˈ ̷ ̷ ̷ ̷ˌ ̷ ̷ noun Etymology: scatter (III) + plot : scatter diagram …   Useful english dictionary

  • Plot (graphics) — Scatterplot of the eruption interval for Old Faithful (a geyser). A plot is a graphical technique for representing a data set, usually as a graph showing the relationship between two or more variables. The plot can be drawn by hand or by a… …   Wikipedia

  • Seriation (archaeology) — In archaeology, seriation is a relative dating method in which assemblages or artifacts from numerous sites, in the same culture, are placed in chronological order. Where absolute dating methods, such as carbon dating, cannot be applied,… …   Wikipedia

  • Chart — For other uses, see Chart (disambiguation) , Graph (disambiguation) , and Diagram For information about charts in Wikipedia, see Wikipedia:Graphs and charts. A pie chart. A chart is a graphical representation of data, in which the …   Wikipedia

  • GeoDA — is a free software package that conducts spatial data analysis, geovisualization, spatial autocorrelation and spatial modeling. The package was developed by the Spatial Analysis Laboratory of the University of Illinois at Urbana Champaign under… …   Wikipedia

  • Mondrian (software) — Mondrian Developer Martin Theus Stable release 1.2 (January 11, 2011) OS Windows, Macintosh, Linux Website http://www.rosuda.org/Mondrian Mond …   Wikipedia

  • Ordinary least squares — This article is about the statistical properties of unweighted linear regression analysis. For more general regression analysis, see regression analysis. For linear regression on a single variable, see simple linear regression. For the… …   Wikipedia

  • List of graphical methods — This is a list of graphical methods with a mathematical basis.Included are diagram techniques, chart techniques, plot techniques, and other forms of visualization.There is also a list of computer graphics and descriptive geometry topics.imple… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”