Allgemeiner Test

Ein allgemeiner Test oder Entscheidungsverfahren ist ein abstraktes Instrument der mathematischen Statistik. Fast alle statistischen Tests, wie bspw. Hypothesentests oder Parameterpunktschätzungen, lassen sich in der Form eines allgemeinen Tests mathematisch erfassen. Ziel eines allgemeinen Tests ist es, auf Grund der (beobachteten) Realisation einer oder mehrerer zuvor definierter Zufallsgrößen, deren genaue Wahrscheinlichkeitsverteilung i.d.R. nicht bekannt ist, bzgl. einer betrachteten Fragestellung eine Entscheidung zu treffen.

Beispiel: Ein Pharmaunternehmen möchte ein neu entwickeltes Medikament auf seine (unbekannte) Wirksamkeit testen. Hierfür bekommt eine bestimmte Anzahl von Patienten das Medikament verabreicht. Aufgrund der gemessenen Wirkung des Medikaments auf die Patienten muss sich das Pharmaunternehmen nun entscheiden, ob man das neue Medikament auf dem Markt einführt oder lieber weiter auf ein altbewährtes Medikament zurückgreift.

Entscheidet sich das Pharmaunternehmen für die Markteinführung des neues Medikaments, so besteht die Gefahr, dass dieses durch das verwendete Entscheidungsverfahren nur fälschlicherweise als besser als das alte Medikament eingestuft wurde. In diesem Fall entstünde dem Pharmaunternehmen ein unnötiger Schaden. Um einen solchen zu vermeiden, liegt jedem allgemeinen Test eine sog. Schadensfunktion zugrunde, mit Hilfe derer man versucht durch die Wahl einer "geeigneten" Entscheidungsfunktion das Risiko einer Entscheidung zu minimieren.

Definition

Gegeben sei ein Messraum $(\Omega,\mathcal A)$ und eine Familie von Wahrscheinlichkeitsmaßen $\mathcal F=\{P_\theta\mid \theta\in\Theta\}$ auf $\mathcal A$ . $Ω$ umfasst hierbei gerade alle möglichen Realisationen oder Beobachtungen. Weiter sei $\mathcal D$ eine Menge von möglichen Entscheidungen.

Eine Abbildung $s:\mathcal D\times\Theta\to\mathbb R_+$ heißt Schadensfunktion.

Eine Abbildung $\delta:\Omega\to\mathcal D$ heißt genau dann allgemeiner Test, Entscheidungsfunktion oder auch Entscheidungsverfahren, wenn für jedes $\theta\in\Theta$ die Abbildung $\omega\mapsto s(\delta(\omega),\theta)$ gerade $(\mathcal A,\mathfrak B)$ -messbar ist. Hierbei bezeichnet $\mathfrak B$ die Borelsche σ-Algebra über $\mathbb R$ .

Gütekriterien

Risiko

Es sei $\mathcal T$ eine Klasse von Entscheidungsfunktionen. Für eine Element $\delta\in\mathcal T$ bezeichnet man

$r_\delta:\Theta\to\mathbb R_+$ vermöge $r_\delta(\theta):=\int_\Omega s(\delta(\omega),\theta)\ dP_\theta(\omega)$

als Risikofunktion. Diese gibt an, welcher Schaden durch die Anwendung des Tests $δ$ im Mittel unter der Verteilung $P θ$ entsteht. Wegen $s\geq0$ existiert diese immer, evtl. jedoch uneigentlich. Weiter bezeichnet man

$r(\delta):=\sup_{\theta\in\Theta} r_\delta(\theta)$

als das Risiko von $δ$ .

Hat man nun weiter eine $σ$ -Algebra $\mathcal S$ über $Θ$ und ein Wahrscheinlichkeitsmaß $μ$ auf $(\Theta,\mathcal S)$ gegeben, so definiert $μ$ eine A-priori-Verteilung oder (subjektive) Vorbewertung auf der Parametermenge. Ist die Risikofunktion $\theta\mapsto r_\delta(\theta)$ messbar bzgl. $\mathcal S$ , so lässt sich hiermit das sog. Bayesrisiko des Tests $δ$ bzgl. $μ$ einführen, und zwar setzt man dann

$r_\delta(\mu):=\int_\Theta r_\delta(\theta)\ d\mu(\theta)$ .

Effizienz

Mit Hilfe des Risikos und der Risikofunktion lassen sich nun zwei allgemeine Tests $\delta_1,\delta_2\in\mathcal T$ miteinander vergleichen. Man sagt $δ 1$ ist mindestens so effizient wie $δ 2$ , wenn

$r_{\delta_1}(\theta)\leq r_{\delta_2}(\theta)\quad \forall \theta\in\Theta$ .

Im Falle einer Vorbewertung $μ$ lassen sich die Tests außerdem mit Hilfe des Bayesrisikos vergleichen. Man sagt dann $δ 1$ ist mindestens so effizient wie $δ 2$ , wenn $r_{\delta_1}(\mu)\leq r_{\delta_2}(\mu)$ .

Optimalität

Die Optimalität eines Tests lässt sich auf verschiedenste Weisen einführen. Man bezeichnet einen Test $\delta^*\in\mathcal T$ als

höchsteffizient in $\mathcal T$ , wenn $r_{\delta^*}(\theta)=\min_{\delta\in\mathcal T} r_\delta(\theta)\ \forall\theta\in\Theta$ gilt.
Minimaxverfahren in $\mathcal T$ , wenn $r(\delta^*)=\min_{\delta\in\mathcal T} r(\delta)$ gilt.
Bayeslösung in $\mathcal T$ bzgl. $μ$ , wenn $r_{\delta^*}(\mu)=\min_{\delta\in\mathcal T} r_\delta(\mu)$ gilt.
multisubjektiv optimal oder $\mathfrak M$ -Minimaxverfahren in $\mathcal T$ , wenn $\mathfrak M$ eine Familie von Wahrscheinlichkeitsmaßen auf $\mathcal S$ ist und gilt $\sup_{\mu\in\mathfrak M} r_{\delta^*}(\mu)=\min_{\delta\in\mathcal T}\sup_{\mu\in\mathfrak M}r_\delta(\mu)$ .

Bei festem Parameter $θ$ ist $\inf_{\delta\in\mathcal T}r_\delta(\theta)$ der unvermeidbare Schaden für jeden Test in $\mathcal T$ . Für einen guten Test wird man deshalb verlangen, dass

$\rho(\delta^*):=\sup_{\theta\in\Theta}\left(r_{\delta^*}(\theta)-\inf_{\delta_\in\mathcal T}r_\delta(\theta)\right)$

möglichst klein wird ("minimal regret"). Deshalb bezeichnet man $δ *$ weiter als

strengsten Test in $\mathcal T$ , wenn $\rho(\delta^*)=\min_{\delta\in\mathcal T}\rho(\delta)$ gilt.

Zusammenhang: Bei den hier aufgeführten Optimalitätskriterien lässt sich die Höchsteffizienz als stärkste Forderung einstufen, denn ist ein Test $δ *$ höchsteffizient in $\mathcal T$ , so ist er bereits Minimaxverfahren, Bayeslösung, multisubjektiv optimal und auch strengster Test.

Beispiele

Hypothesentest

Bei einem Hypothesen- oder Signifikanztest betrachtet man zwei sich gegenseitig ausschließende Hypothesen $H 0$ und $H 1$ , von denen man in der Regel eine, bspw. $H 0$ , versucht aufgrund einer Beobachtung $\omega\in\Omega$ zu verwerfen. Die Menge der möglichen Entscheidungen ist deshalb von der Form $\mathcal D=\{d_1,d_2\}$ , wobei man definiert:

d 1 : =

"Hypothese

H 0

kann verworfen werden."

d 2 : =

"Hypothese

H 0

kann nicht verworfen werden, es lässt sich also keine Folgerung aus dem Experiment ziehen."

Parameterpunktschätzung

Gegeben sei eine Zufallsgröße $X:\Omega'\to\Omega$ bzgl. zweier Messräume $(\Omega',\mathcal A')$ und $(\Omega,\mathcal A)$ , die der Verteilungsfamilie $\mathcal F=\{P_\theta\mid\theta\in\Theta\}$ unterliegt. Unbekannt sei hierbei der "wahre" Parameter $θ$ . Diesen, bzw. allgemeiner einen von $θ$ abhängenden Wert $λ(θ)$ , gilt es zu schätzen. Als Entscheidungsraum betrachtet man deshalb $\mathcal D=\lambda(\Omega)$ . Als Schadensfunktion verwendet man häufig

$s:\mathcal D\times\Theta\to\mathbb R_+,\ s(d,\theta)=(d-\lambda(\theta))^2$ .

Damit ergibt sich für einen Test $\delta:\Omega\to\mathcal D$ als Risikofunktion die mittlere quadratische Abweichung der Schätzung von dem zu schätzenden Wert, denn

$r_\delta(\theta)=\int_\Omega s(\delta(\omega),\theta)\ dP_\theta(\omega)=\mathbb E_\theta((\delta(X)-\lambda(\theta))^2)$ .

Parameterbereichsschätzung

Betrachtet wird wieder die Zufallsgröße $X$ . Schätzen möchte man einen Bereich, in dem man den "wahren" Parameter $θ$ vermutet. Man setzt hierfür $\mathcal D:=\mathfrak P(\Theta)\backslash\{\emptyset\}$ . Die Leere Menge schließt man als Entscheidung aus, da das Schätzen dieser nicht sinnvoll wäre. Als Schadensfunktion bietet sich die Abbildung $s:\mathcal D\times\Theta\to\mathbb R_+$ mit $s(d,\theta):=1_{d^\complement}(\theta)$ an. Mit ihr erhält man für einen Test $\delta:\Omega\to\mathcal D$ die Risikofunktion

$r_\delta(\theta)=\int_\Omega s(\delta(\omega),\theta)\ dP_\theta(\omega)= \int_\Omega 1_{\delta(\omega)^\complement} (\theta)\ dP_\theta(\omega)= P_\theta(\{\omega\mid\theta\notin\delta(\omega)\})\ ,$

d.h. $r δ (θ)$ ist gerade die Wahrscheinlichkeit, mit welcher der Parameter $θ$ nicht in der geschätzten Menge liegt. Man nennt $r δ (θ)$ deshalb auch die Irrtumswahrscheinlichkeit des Verfahrens $δ$ für den Parameter $θ$ . Das Risiko $r(\delta)=\sup_{\theta\in\Theta} r_\delta(\theta)$ bezeichnet man als Signifikanzschranke von $δ$ .

Kategorien:

Schätztheorie
Testtheorie

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

Test (Begriffsklärung) — Test bezeichnet: Test, allgemein eine Funktionsprüfung Klassenarbeit in der Umgangssprache test (Zeitschrift), eine Zeitschrift der Stiftung Warentest Allgemeiner Test, ein Instrument der mathematischen Statistik Statistischer Test… … Deutsch Wikipedia
Shapiro-Wilk-Test — Der Shapiro Wilk Test ist ein statistischer Signifikanztest, der die Hypothese überprüft, dass die zugrunde liegende Grundgesamtheit einer Stichprobe normalverteilt ist. Die Nullhypothese H0 nimmt an, dass eine Normalverteilung der… … Deutsch Wikipedia
Post-Hoc-Test — Post Hoc Tests sind Signifikanztests aus der mathematischen Statistik. Mit der einfaktoriellen ANOVA, dem Kruskal Wallis Test oder dem Median Test wird nur festgestellt, dass es in einer Gruppe von Mittelwerten signifikante Unterschiede gibt. Die … Deutsch Wikipedia
IQ-Test — Ein Intelligenztest ist ein Instrument der psychologischen Diagnostik zur Messung der Intelligenz einer Person. Da Intelligenz und ihre Bereiche unterschiedlich definiert werden können, gibt es sehr verschiedenartige Intelligenztests. Ziel der… … Deutsch Wikipedia
HIV-Test — Ein HIV Test ist ein Verfahren, mit dessen Hilfe festgestellt werden kann, ob eine Person oder eine Blutspende mit dem Humanen Immundefizienzvirus (HIV) infiziert ist. Mit Hilfe von HIV Tests können HI Viren in Serum, Plasma, Speichel oder Urin… … Deutsch Wikipedia
Crash test — Frontal offset crash test of a Hyundai Tucson by the Insurance Institute for Highway Safety … Wikipedia
C-Test — Ein C Test ist ein schriftlicher Test zur Feststellung der allgemeinen Sprachbeherrschung in einer Fremdsprache. Er besteht aus mindestens fünf Texten mit zwanzig bis fünfundzwanzig Lücken, die vom Probanden ergänzt werden müssen. Dabei sind nie… … Deutsch Wikipedia
Automatic Test Equipment — (ATE) ist ein allgemeiner Begriff für messtechnische Apparaturen, die von der Chip und Elektronik Industrie während der Produktion zum testen benutzt werden. Integrierter Schaltkreise im Wafertest oder Chip und Modul Test; analoger Bauteile im… … Deutsch Wikipedia
Entscheidungsfunktion — Ein allgemeiner Test oder Entscheidungsverfahren ist ein abstraktes Instrument der mathematischen Statistik. Fast alle statistischen Tests, wie bspw. Hypothesentests oder Parameterpunktschätzungen, lassen sich in der Form eines allgemeinen Tests… … Deutsch Wikipedia
Entscheidungsverfahren (Begriffsklärung) — Der Begriff Entscheidungsverfahren hat folgende Bedeutungen: Verfahren der Informationsgewinnung und verarbeitung, siehe Entscheidungsverfahren Verfahren im Sinn der Logik und Informatik, siehe Entscheidbar Instrument der mathematischen Statistik … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Allgemeiner Test

Inhaltsverzeichnis

Definition