Multiple-Choice


Multiple-Choice

Multiple Choice (kurz: MC, deutsch: Mehrfachauswahl) ist ein in Prüfungen, Tests und Umfragen verwendetes Format, bei dem zu einer Frage mehrere vorformulierte Antworten zur Auswahl stehen.

Inhaltsverzeichnis

Beispiele

Welche Politiker waren in der Brandt-Regierung Bundesminister?
  1. Karl Schiller
  2. Herbert Wehner
  3. Rainer Barzel
  4. Georg Leber
  5. Erich Mende

Die Anzahl richtiger Alternativen ist nicht vorgegeben. Richtig sind 1 und 4. Die Alternativen 2, 3 und 5 dienen als Distraktoren.

Welches ist der größte Binnensee, der vollständig in Deutschland liegt?
  1. Der Bodensee
  2. Die Müritz
  3. Das Steinhuder Meer

Aus dem Fragetext ist klar, dass nur eine Alternative richtig sein kann (die 2).

Unterschiedliche Formate und Begrifflichkeiten

In manchen Disziplinen wird neben “Multiple Choice” auch der Begriff “Single Choice” verwendet; “Single Choice” steht dann für Fragen, bei denen als Antwort genau eine Alternative ausgewählt werden muss, während bei “Multiple Choice” auch mehrere Alternativen richtig sein können, unter Umständen auch alle oder keine.

In anderen Kontexten hingegen gilt die Verabredung, dass bei Multiple-Choice-Aufgaben immer nur eine Antwortalternative richtig sein kann, als so selbstverständlich, dass darauf gar nicht explizit hingewiesen wird; so zum Beispiel bei Prüfungen an Schulen und Hochschulen in den USA oder Australien.

Wenn die Antwortalternativen verschiedene Grade einer Bewertung darstellen (z. B. „sehr zufrieden“ bis „sehr unzufrieden“), spricht man in der Sozialforschung nicht von Multiple Choice, sondern von einem skalierten Frage-Verfahren.

In speziellen Anwendungen müssen Kreuzchen in einer Matrix gesetzt werden. So kann man mehr Kombinationsmöglichkeiten realisieren.

Zweistufige Testaufgaben

Im Medizinstudium war bis vor einigen Jahren ein MC-Format gebräuchlich, in dem zunächst verschiedene Aussagen vorgeschlagen werden, von denen eine beliebige Anzahl zutreffen kann:

  1. Aussage 1
  2. Aussage 2
  3. Aussage 3
  4. Aussage 4

Anschließend folgt die eigentliche MC-Frage, bei der nur eine Alternative richtig sein kann:

A) Aussagen 1 und 2 treffen zu.
B) Keine Aussage trifft zu.
C) Alle Aussagen treffen zu.
D) Aussagen 1, 3 und 4 treffen zu.
E) Nur Aussage 4 trifft zu.

Multiple-Choice-Aufgaben in Leistungstests

Entwicklung von Testaufgaben

Die Konstruktion von MC-Fragen ist aufwändig, weil die richtige(n) Lösung(en) nicht ohne Fachwissen (das ja geprüft werden soll) ersichtlich sein sollen. Die falschen Antwortmöglichkeiten (Distraktoren) sollten auf Anhieb plausibel wirken, mit dem entsprechenden Wissen aber schnell als solche entlarvt werden können. Eine nachlässige Auswahl der Distraktoren kann sich negativ auf die Aussagekraft des MC-Tests auswirken.

Bewertung von Testleistungen

Für die Punktevergabe in Leistungstests mit Multiple-Choice-Fragen gibt es vor allem zwei Varianten, die hauptsächlich angewandt werden. Entweder werden nur richtige Antworten gewertet und falsch gesetzte Kreuzchen ignoriert, oder aber die falschen Kreuze führen zu einem Punktabzug. Um zu vermeiden, dass ein Teilnehmer Antworten nur errät, statt Sachkenntnis an den Tag zu legen, wird die zweite Methode in der Regel bevorzugt. Normalerweise wird jedes Kästchen mit einem Punkt gewertet, man kann einen Multiple-Choice-Test aber auch gewichten, indem man schwereren oder wichtigeren Fragen mehr Punkte zuweist. Der Schwierigkeitsgrad kann trotz der eingeschränkten Wahlmöglichkeiten stark variieren.

Vorteile

Mit MC-Tests können die meisten Lernziele (mit Ausnahme von kreativen Leistungen) abgefragt werden. Darüber hinaus lassen sie sich in der Regel maschinell auswerten. Sie werden deshalb sehr häufig eingesetzt (z. B. beim IQ-Test, bei der Führerscheinprüfung und verschiedenen Qualifikationsprüfungen). Beim medizinischen Staatsexamen nach der Approbationsordnung sind MC-Tests für den schriftlichen Teil vorgeschrieben. Aber auch Prüfungen an Schulen und Universitäten werden manchmal auf diese Weise abgehalten. Bei Auswahlverfahren von Firmen erfreut sich dieser Test wachsender Beliebtheit, nicht zuletzt wegen der sehr einfachen Auswertung: man benötigt lediglich eine Lösungsschablone.

Nachteil: Raten, „Testfähigkeit“

Die Fähigkeit, bei unvollständigem Fachwissen aus rein formalen Hinweisen die richtige Lösung zu erschließen oder zumindest einzelne Distraktoren zu eliminieren, wird in Amerika seit langem unter dem Begriff “testwiseness” (Testfähigkeit) diskutiert (Millman et al. 1965). Bei schlecht konstruierten Tests hilft oft schon die Faustregel, im Zweifel die längste Antwort anzukreuzen. Einen parodistischen Test, der nur durch rein formales Schließen gelöst werden kann, hat die New Yorker Schulbehörde veröffentlicht: http://www.emsc.nysed.gov/osa/assesspubs/pubsarch/ActivityTestYourTestwiseness.pdf.

Kubinger (2005) schreibt aus der Sicht eines Psychologen zur oft unterschätzten Auswirkung des Rateeffekts auf die diagnostische Validität von MC-Tests: „Die Wahrscheinlichkeit, dass ein Item eines Tests [= Frage im MC-Test; Anm. d. Verf.] nur zufällig richtig beantwortet und insofern „gelöst“ wird, ist offensichtlich umso größer, je weniger Antwortmöglichkeiten geboten werden. Im heute verfügbaren Testinventar der Psychologischen Diagnostik sind es zumeist fünf, nämlich die Lösung samt vier „Distraktoren“. Für solche Tests beträgt die A-priori-Ratewahrscheinlichkeit 1/5 = 20 %, d. h., auch Testpersonen ohne jede entsprechend vorausgesetzte Fähigkeit würden durchschnittlich 1/5 aller Items „lösen“. Verschärft wird das Problem dadurch, dass für Testpersonen mit wenigstens minderer Fähigkeit nicht alle Antwortmöglichkeiten gleich plausibel sind, so dass von den fünf häufig eine, zwei, manchmal drei gemäß Falsifikationsstrategie [entspricht hier sinngemäß in etwa: Ausschlussverfahren, siehe Falsifizierung; Anm. d. Verf.] richtiger Weise außer Betracht geraten, was die Ratewahrscheinlichkeit pro Item individuell bis auf 50 % erhöhen kann.“

Multiple-Choice in internationalen Vergleichen

Multiple-Choice-Aufgaben werden auch in internationalen Schulleistungsvergleichen wie TIMSS, PIRLS oder PISA eingesetzt. Dabei wird das amerikanische Standardformat verwendet, in dem in aller Regel vier bis fünf Alternativen vorgegeben werden, von denen genau eine als richtig gewertet wird. Diese Spielregel wird von den Testautoren für so selbstverständlich gehalten, dass sie den Testteilnehmern nicht einmal ausdrücklich erklärt wird. Im deutschen Sprachraum aber, wo dieses Aufgabenformat wenig gebräuchlich ist, haben in den ersten PISA-Runden über zehn Prozent der Schüler bei einzelnen Aufgaben mehr als eine Alternative angekreuzt.[1]

Eine kanadische Studie zeigt, dass sich der Vorteil nordamerikanischer Studenten, die aus ihrer Schulzeit her MC-Tests gewohnt sind, auch in studienbegleitenden Prüfungen noch nachweisen lässt.[2]

Literatur

  • Kubinger, K.D. (2005). Objektive psychologisch-diagnostische Verfahren. In H. Weber & T. Rammsayer (Hrsg.), Handbuch der Persönlichkeitspsychologie und Differentiellen Psychologie aus Handbuch der Psychologie (S. 158-165). Göttingen: Hogrefe.
  • Millman J., Bishop C. H., Ebel R. (1965). An Analysis of Test-Wiseness. Educ. Psychol. Meas. 25 (3) 707–726.

Weblinks

Quellenangaben

  1. J. Wuttke, Die Insiginifikanz signifikanter Unterschiede, S. 171 ff., in: T. Jahnke, W. Meyerhöfer: PISA & Co - Kritik eines Programms. Hildesheim: Franzbecker 2. Auflage 2007. Auch http://www.messen-und-deuten.de/pisa/Wuttke2007b.pdf. Wuttke weist darauf hin, dass das den Test über die unmittelbar betroffenen Aufgaben hinaus verzerrt, denn es kostet viel mehr Zeit, vier oder fünf Alternativen auf richtig/falsch zu prüfen, statt unter ihnen die plausibleste auszuwählen.
  2. A. Mahamed et al., “Testwiseness” Among International Pharmacy Graduates and Canadian Senior Pharmacy Students, Am. J. Pharm. Educ., 70 (6) 131.

Wikimedia Foundation.