Confusion Matrix

Confusion Matrix

Eine Konfusionsmatrix (oder Wahrheitsmatrix) dient zur Beurteilung eines Klassifikators, indem in einer quadratischen Tabelle die Häufigkeiten des Auftretens für alle möglichen Kombinationen von ermittelter Klasse und tatsächlicher Klasse eingetragen werden. Die Konfusionsmatrix ist ein einfacher Spezialfall einer Kontingenztafel mit zwei nominalen Variablen (dem Urteil des Klassifikators und der tatsächlichen Klasse).

Allgemeinfall

Für ein N-Klassen-Problem besteht die Konfusionsmatrix aus einer NxN-Matrix. Die richtig vorhergesagten Objekte befinden sich auf der Diagonalen, die falsch vorhergesagten Objekte befinden sich in den übrigen Zellen der Matrix. Eingetragen wird jeweils die Auftrittshäufigkeit einer Merkmalskombination.

Zur Beurteilung des Klassifikator anhand der Ergebnisse in einer Konfusionsmatrix kann für N=2 der Vierfeldertest und im allgemeinen Fall der Chi-Quadrat-Test verwendet werden. Dabei wird geprüft, ob die Einschätzung des Klassifikators unabhängig von den tatsächlichen Klassen ist oder signifikant mit ihnen korreliert (Unabhängigkeitstest). Für kleine Werte sollte der Exakte Fisher-Test vorgezogen werden. Die Stärke der Korrelation kann mit dem Phi-Koeffizient (N=2) beziehungsweise dem allgemeinen Kontingenzkoeffizienten abgeschätzt werden.

Für die praktische Beurteilung werden die Häufigkeiten gegebenenfalls mit einer Kostenmatrix multipliziert.

Wichtig: Die Dimensionen der Konfusionsmatrix sind nicht normiert. Im Beispiel steht die Wahrheit in den Spalten und die Schätzung in den Zeilen, je nach verwendeter Software können die Dimensionen aber vertauscht sein.

Zwei-Klassen-Fall

Linke und rechte Hälfte bilden zwei Klassen, die durch den Klassifikator (Oval) nicht ganz richtig getrennt werden.

Bei einem einfachen Zwei-Klassen-Problem werden häufig die Bezeichnungen positive Klasse und negative Klasse verwendet. Die Einträge der Konfusionsmatrix sind häufig englisch bezeichnet als true positive (TP), false positive (FP), true negative (TN) und false negative (FN).

tatsächliche Klasse
positiv negativ
ermittelte
Klasse
positiv TP (richtig positiv) FP (falsch positiv)
negativ FN (falsch negativ) TN (richtig negativ)

Aus den Einträgen der Wahrheitsmatrix lassen sich weitere Kennwerte zur Beurteilung eines Klassifikators berechnen. Dies sind die Sensitivität (auch als Recall), Spezifität, der positive Vorhersagewert (auch Relevanz oder auch als Precision), der negative Vorhersagewert (auch Segreganz), die Korrektklassifikationsrate sowie die Falschklassifikationsrate.

Anwendung

Neben der Beurteilung eines Klassifikators durch den Vergleich mit den tatsächlichen Klassen können mit Hilfe einer Konfusionsmatrix auch zwei verschiedene Klassifikatoren verglichen werden.


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Confusion matrix — In the field of artificial intelligence, a confusion matrix is a specific table layout that allows visualization of the performance of an algorithm, typically a supervised learning one (in unsupervised learning it is usually called a matching… …   Wikipedia

  • Matrix (monde imaginaire) — Matrix Matrix Titre original The Matrix Titre québécois La Matrice Réalisation Andy et Larry Wachowski Acteurs principaux …   Wikipédia en Français

  • Matrix (univers de fiction) — Matrix Matrix Titre original The Matrix Titre québécois La Matrice Réalisation Andy et Larry Wachowski Acteurs principaux …   Wikipédia en Français

  • The Matrix — Matrix Matrix Titre original The Matrix Titre québécois La Matrice Réalisation Andy et Larry Wachowski Acteurs principaux …   Wikipédia en Français

  • Symplectic matrix — In mathematics, a symplectic matrix is a 2n times; 2n matrix M (whose entries are typically either real or complex) satisfying the condition:M^T Omega M = Omega,.where MT denotes the transpose of M and Omega; is a fixed nonsingular, skew… …   Wikipedia

  • Neo (Matrix) — Este artículo o sección se encuentra desactualizado. Es posible que la información suministrada aquí haya cambiado o sea insuficiente. Neo Personaje de …   Wikipedia Español

  • Classification rule — See also: Statistical classification and Classification in machine learning Given a population whose members can be potentially separated into a number of different sets or classes, a classification rule is a procedure in which the elements… …   Wikipedia

  • Glossaire du data mining — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Cluster analysis — The result of a cluster analysis shown as the coloring of the squares into three clusters. Cluster analysis or clustering is the task of assigning a set of objects into groups (called clusters) so that the objects in the same cluster are more… …   Wikipedia

  • Chi-Quadrat-Vierfeldertest — Die Artikel Vierfelderkorrelation und Vierfeldertest überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”