Fehler 1. und 2. Art

Im Rahmen einer Klassifizierung von Objekten lassen ein oder mehrere spezielle Merkmale, als Klassifikatoren bezeichnet, eine Auftrennung in Klassen zu. Wird mit einem Test auf ein Merkmal die Klassenzugehörigkeit ermittelt, können verschiedene Arten von Zuordnungsfehlern auftreten. Aus diesen lassen sich verschiedene statistische Kennwerte wie Sensitivität, Spezifität, Relevanz und Segreganz errechnen, die die Güte des zum Klassifikator erhobenen Tests oder auch der gewählten Klassifikation charakterisieren.

Inhaltsverzeichnis

1 Wahrheitsmatrix eines hypothetischen Beispiels
2 Reale Beispiele
- 2.1 HIV in der BRD
- 2.2 Herzinfarkt in USA
3 Statistische Grundlagen
4 Siehe auch
5 Weblinks

Wahrheitsmatrix eines hypothetischen Beispiels

Ein Test (oval) soll kranke (links) und gesunde (rechts) Menschen von einander unterscheiden

Mit einem medizinischen Labortest soll festgestellt werden, ob eine Person eine bestimmte Krankheit hat. Ein statistischer Test kann zeigen, ob der Labortest hierfür geeignet ist, also wie hoch seine Güte zur Trennung ist. Die statistische Nullhypothese H₀ lautet „Test nicht geeignet zur Erkennung, Testergebnis ist zufällig“, die Alternativhypothese H₁ „Test positiv = Person ist krank, Test zur Erkennung geeignet“.

Der tatsächliche Gesundheitszustand des Probanden, ermittelt anhand anderer „harter“ Fakten (krank | gesund) und das Testergebnis (positiv | negativ) lassen vier Kombinationen zu, die in einer Wahrheitsmatrix wie folgt dargestellt werden:

	Person ist krank (a+c)	Person ist gesund (b+d)
Test positiv (a+b)	richtig positiv (a)	falsch positiv (b) = Fehler 1. Art
Test negativ (c+d)	falsch negativ (c) = Fehler 2. Art	richtig negativ (d)

In den Fällen a (Person ist krank und die Krankheit wird erkannt) und d (Person ist gesund und der Test meldet keine Krankheit) ist die Einteilung richtig. In den Fällen b (falsche Diagnose auf Krankheit) und c (Krankheit wird vom Test nicht erkannt) liegt ein Fehler vor.

Statistisch wird der Fehler im Fall b, wo ein falsch positives Testergebnis real Gesunde als Kranke identifiziert, als Fehler 1. Art oder α-Fehler bezeichnet. Im Fall c mit dem falsch negativen Testergebnis, wo ein Kranker nicht erkannt wird, spricht man vom Fehler 2. Art oder β-Fehler.

Trägt man die absolute Häufigkeit der Probanden in eine Vierfeldertafel ein, kann man verschiedene Kenngrößen der Klassifizierung errechnen, die ihrerseits eine Gütebeschreibung des verwendeten Klassifikators (des verwendeten medizinischen Tests) gestatten:

Die Sensitivität (Richtig-Positiv-Rate) a/(a+c) ist die Wahrscheinlichkeit, dass eine vorhandene Krankheit auch erkannt wird.
Die Spezifität (Richtig-Negativ-Rate) d/(b+d) ist die Wahrscheinlichkeit, dass es bei einem gesunden Menschen keinen Falschalarm gibt.
Die Falsch-Positiv-Rate b/(b+d) ist die Wahrscheinlichkeit, dass bei einer gesunden Person trotzdem eine Krankheit (positive Diagnose) erkannt wird (Falschalarm).
Die Falsch-Negativ-Rate c/(a+c) ist die Wahrscheinlichkeit, dass bei einer kranken Person trotzdem keine Krankheit (negative Diagnose) erkannt wird.
Die Relevanz (Positiver Vorhersagewert) a/(a+b) ist die Wahrscheinlichkeit, dass die Person bei einer positiven Diagnose auch wirklich krank ist.
Die Segreganz (Negativer Vorhersagewert) d/(c+d) ist die Wahrscheinlichkeit, dass die Person, wenn keine Krankheit erkannt wurde, auch wirklich gesund ist.
Die Korrektklassifikationsrate (a+d)/(a+b+c+d) ist die Wahrscheinlichkeit für eine richtige Diagnose.
Die Falschklassifikationsrate (b+c)/(a+b+c+d) ist die Wahrscheinlichkeit für eine falsche Diagnose.

Die Raten 1. und 4., 2. und 3. sowie 7. und 8. addieren sich zu jeweils 100%.

Diese Kennwerte beeinflussen sich gegenseitig, so kann man die Rate der falsch positiven Ergebnisse auf Kosten der Falschnegativ-Rate verringern und umgekehrt. Anders formuliert: Je sicherer Kranke mit dem Test identifiziert werden sollen (höhere Sensitivität), umso mehr Gesunde werden auch fälschlich als Kranke klassifiziert. Darüber hinaus wird auch ein extremes Ungleichgewicht zwischen Kranken und Gesunden die Kenngrößen verfälschen. Ist beispielsweise die Anzahl der an einem Test teilnehmenden Kranken erheblich geringer als die der Gesunden, so führt dies im allgemeinen zu einem geringen Wert in der Relevanz.

Dieser Zusammenhang ist bei verschiedenen Labortests zu bedenken: Preiswerte Screening-Tests werden so justiert, dass eine möglichst kleine Anzahl falsch negativer Ergebnisse vorliegt. Die produzierten falsch positiven Testergebnisse werden anschließend durch einen (teureren) Bestätigungstest identifiziert. Für schwerwiegende Erkrankungen sollte immer ein Bestätigungstest durchgeführt werden. Dieses Vorgehen ist für die Bestimmung von HIV sogar gefordert.

Je nach Einsatzgebiet kann eine Fehlklassifikation mehr oder weniger schlimme Folgen haben. Ihre Auswirkungen lassen sich zur Bewertung eines Klassifikators in einer Kostenmatrix angeben.

Ein Diagramm der Klassifikatorgüte liefert die Receiver Operating Characteristic (ROC), die auch eine Optimierung des Grenzwertes ermöglicht.

Reale Beispiele

HIV in der BRD

Das Ziel eines HIV-Tests sollte die möglichst sichere Erkennung eines Infizierten sein. Aber welche Konsequenzen ein falsch positiver Test haben kann, zeigt das Beispiel eines Menschen, der sich auf HIV testen lässt und dann aufgrund eines falsch-positiven Ergebnisses Suizid begeht.

Bei einer angenommenen Genauigkeit von 99,9 % des kombinierten HIV-Tests sowohl für positive als auch negative Ergebnisse (Sensitivität und Spezifität = 0,999) und der aktuellen Verbreitung von HIV (Stand 2003) in der deutschen Bevölkerung (80.000.000 Einwohner, davon 40.000 HIV-positiv) wäre ein allgemeiner HIV-Test verheerend.

	HIV pos.	HIV neg.
HIV-Test positiv	39 960	80 000	119 960
HIV-Test negativ	40	ca. 80 Mio
Summe			80 Mio

Zwar würden von 40.000 tatsächlich Erkrankten lediglich 40 HIV-Infizierte fälschlicherweise nicht erkannt, aber ca. 80.000 Personen würden fälschlicherweise als HIV-positiv diagnostiziert. Von 119.960 positiven Ergebnissen wären knapp 67 % falsch positiv. Somit liegt die Wahrscheinlichkeit, dass jemand, der positiv getestet wurde, auch wirklich HIV-positiv ist, bei nur 32 %. Anders formuliert, die Relevanz beträgt 32 %.

Ein zweiter Test kann die Unsicherheit hingegen drastisch reduzieren. Die Wahrscheinlichkeit, dass jemand HIV-positiv ist, wenn er zwei mal positiv getestet wurde, liegt schon bei 99.8 %.

Herzinfarkt in USA

In den USA werden pro Jahr etwa 4 Millionen Frauen und Männer aufgrund von Schmerzen in der Brust unter der Verdachtsdiagnose Herzinfarkt in eine Klinik eingewiesen. Im Verlauf der aufwändigen und teuren Diagnostik stellt sich dann heraus, dass von diesen Patienten nur etwa 32 % tatsächlich einen Infarkt erlitten haben. Bei 68 % war die Diagnose Infarkt nicht korrekt (falsch positive Verdachtsdiagnose). Andererseits werden in jedem Jahr etwa 34.000 Patienten aus dem Krankenhaus entlassen, ohne dass ein tatsächlich vorhandener Herzinfarkt erkannt wurde (ca. 0,8 % falsch negative Diagnose).

	Herzinfarkt pos.	Herzinfarkt neg.
Untersuchung positiv	1,3 Mio
Untersuchung negativ	34 000	2,75 Mio
Summe	32 %	68 %	ca. 4 Mio

Auch hier ist die Sensitivität der Untersuchung ähnlich hoch, nämlich 99,8 %. Zur Spezifität kann man aber nichts sagen, weil die falsch-positiven Ergebnisse der Untersuchung nicht erwähnt werden, sondern nur die falsch-positiven Eingangsdiagnosen, die auf der Angabe "Herzschmerz" fußen. Betrachtet man aber ausschließlich diese Eingangsdiagnose, dann ist die Angabe der 34.000 Patienten, die fälschlich entlassen werden, wertlos, denn sie haben hiermit nichts zu tun. Man benötigt nämlich die Zahl der mit Herzinfarkt nicht eingewiesenen, die wahrscheinlich keinen Herzschmerz hatten.
Man sollte sich immer davor hüten, solche vermischte Angaben verwerten zu wollen und unbedingt auf eine präzise Formulierung der These achten.

Statistische Grundlagen

	Wahrer Sachverhalt: H₀	Wahrer Sachverhalt: H₁
durch einen statistischen Test fällt eine Entscheidung für die Nullhypothese H₀	1-alpha	beta (Fehler 2. Art, falsch negativ)
durch einen stat.Test fällt eine Entscheidung für die alternative Hypothese H₁	alpha (Fehler 1. Art, falsch positiv)	1-beta. Power

Beispiele

Ein Angeklagter ist schuldig oder unschuldig und soll verurteilt oder freigelassen werden:

	Angeklagter ist unschuldig	Angeklagter ist schuldig
durch ein Gericht fällt eine Entscheidung für: unschuldig	richtige Entscheidung	ein Schuldiger wird freigesprochen
durch ein Gericht fällt eine Entscheidung für: schuldig	ein Unschuldiger wird verurteilt	richtige Entscheidung

Eine Person ist für einen Sicherheitsbereich zugangsberechtigt oder nicht zugangsberechtigt und soll eingelassen oder nicht eingelassen werden:

	Person ist zugangsberechtigt	Person ist nicht zugangsberechtigt
eine Zutrittskontrolle fällt eine Entscheidung für: Person ist zugangsberechtigt	richtige Entscheidung	Unbefugter erhält Zugang
eine Zutrittskontrolle fällt eine Entscheidung für: Person ist nicht zugangsberechtigt	Berechtigter wird nicht eingelassen	richtige Entscheidung

Siehe auch

Weblinks

Interaktive Veranschaulichung

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

Fehler — Anzeige eines Fehlers; die eine Uhr ist nicht einfach „stehen geblieben“, sondern zeigt mit der 12 Uhr Position ihre Betriebsstörung an … Deutsch Wikipedia
Art (Biologie) — Die Art oder Spezies (lat. species „Art“) ist die Grundeinheit der biologischen Systematik. Eine allgemeine Definition der Art oder Spezies, die die theoretischen und praktischen Anforderungen aller biologischen Teildisziplinen gleichermaßen… … Deutsch Wikipedia
Nullhypothese und Alternativhypothese — Unter Hypothese versteht man in der Statistik eine anhand empirischer Daten zu prüfende Annahme. Man unterscheidet als Gegensatzpaar Nullhypothese, H0, und Alternativhypothese, HA oder H1. Häufig sagt die Nullhypothese aus, dass ein bestimmter… … Deutsch Wikipedia
Logischer Fehler — Dieser Artikel wurde in der Qualitätssicherung Philosophie eingetragen. Dabei werden Artikel gelöscht, die nach Fristablauf sich als nicht relevant herausstellen oder kein akzeptables Niveau erreicht haben. Bitte hilf mit, die inhaltlichen Mängel … Deutsch Wikipedia
Und — Und, ein Bindewörtchen, und zwar das einfachste in der ganzen Sprache, welches bloß das Daseyn eines Dinges neben dem andern bezeichnet. Es verbindet aber, 1. Einzelne Wörter, Begriffe und Umstände, da es denn allemahl zwischen den beyden Wörtern … Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart
Fehler zweiter Art — Die Artikel falsch negativ und Fehler 2. Art überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen Baustein … Deutsch Wikipedia
Fehler 1. Art — Der Fehler 1. Art ist ein Fachbegriff der Statistik. Er bezieht sich auf eine spezielle Methode der mathematischen Statistik, den sogenannten Hypothesentest. Beim Test einer Hypothese liegt ein Fehler 1. Art (auch α Fehler) vor, wenn die… … Deutsch Wikipedia
Fehler 2. Art — Darstellung möglicher Werte der Wahrscheinlichkeit für einen Fehler 2. Art (rot) am Beispiel eines Signifikanztests für einen Parameter μ. Der Fehler 2. Art ist vom Wert des wahren Parameters μ abhängig. Je dichter dieser bei dem unter der… … Deutsch Wikipedia
Fehler erster Art — Die Artikel falsch positiv und Fehler 1. Art überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen Baustein … Deutsch Wikipedia
Fehler — Versehen; Inkorrektheit; Lapsus (umgangssprachlich); Missgriff; Flüchtigkeitsfehler; Schnitzer (umgangssprachlich); Patzer (umgangssprachlich); Irrtum; … Universal-Lexikon

Academic dictionaries and encyclopedias

Fehler 1. und 2. Art

Inhaltsverzeichnis

Wahrheitsmatrix eines hypothetischen Beispiels

Reale Beispiele

HIV in der BRD

Herzinfarkt in USA

Statistische Grundlagen

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Fehler 1. und 2. Art

Inhaltsverzeichnis

Wahrheitsmatrix eines hypothetischen Beispiels

Reale Beispiele

HIV in der BRD

Herzinfarkt in USA

Statistische Grundlagen

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link