Morphologische Analyse (Linguistik)

Morphologische Analyse (Linguistik)

Unter morphologischer Analyse versteht man in der Computerlinguistik ein Verfahren, welches die morphologischen, syntaktischen und evtl. semantischen Eigenschaften von Wörtern ermittelt. Im Einzelnen können morphologische Analyseverfahren die folgenden Teilaufgaben lösen:

  1. Segmentierung, d.h. Aufteilung von komplexen Wörtern in freie und gebundene Morpheme. Zu letzteren zählen Präfixe und Suffixe.
  2. Lemmatisierung: Zurückführung eines einfachen oder komplexen Wortes auf sein Lemma und Ermittlung seiner syntaktischen Eigenschaften. Beispiel: Das Wort "Häusern" wird auf sein Lemma "Haus" mit den Eigenschaften {Nomen, Plural, Dativ} reduziert.
  3. Ermittlung der Wortstruktur; diese wird oft in Zusammenhang mit einer wortsemantischen Analyse bestimmt.


Inhaltsverzeichnis

Probleme

  • Regelmäßige und unregelmäßige Allomorphie
    • Regelmäßige Allomorphie ist beispielsweise das Einfügen von e bei Verbformen mit bestimmten Stämmen, beispielsweise "rechnen" - "rechnest", aber "lieben" - "liebst". Dazu zählt auch die Umlautung von Vokalen bei Pluralnomen ("Wald" - "Wälder") oder bei Komparativ- und Superlativformen von Adjektiven ("rot" - "röter").
    • Unregelmäßige Allomorphie besteht beispielsweise beim Ablaut ("singen" - "sang" - "gesungen") bzw. bei Stammänderungen ("denken" - "gedacht").
  • Unbeschränkte Derivation und Komposition: Im Deutschen kann man fast beliebig lange Wörter durch Komposition und Derivation bilden, beispielsweise "Grundstückverkehrsgenehmigungszuständigkeitsübertragungsverordnung" oder "Ururururgroßvater". Da es beliebig viele solche Wörter gibt, reicht ein statisches Lexikon, in dem alle Wortformen verzeichnet sind, nicht aus. Vielmehr muss das Wort aktiv in seine Teile segmentiert werden, um so unter Ausnutzung wortsyntaktischer Regularitäten (im Deutschen steht beispielsweise der die grundlegenden Eigenschaften bestimmende Teil ganz rechts) die Worteigenschaften zu ermitteln.

Verfahren

Die meisten Verfahren zur morphologischen Analyse basieren auf endlichen Automaten, genauer endlichen Transduktoren. Das verwendete theoretische Modell ist meist das sog. Two-Level-Modell (Koskeniemi), bei dem quasi-kontextsensitive Regeln zwischen der lexikalischen Form eines Morphems und seiner Oberflächenform (Morph) vermitteln. Eine solche Regel für das Deutsche könnte z.B. folgendermaßen aussehen:

  • ε → e / (ppn|chn|tm|d|tt){VERBSTEM} _ (n|t|st){VERBFLEX}

Diese Regel erlaubt die Ersetzung des leeren Wortes durch e (effektiv also ein Einfügen von e) nach einem Verbstamm auf ppn, chn, tm, d oder tt ("wappnen", "rechnen", "atmen", "gründen", "retten") vor den verbalen Flexiven n, t oder st. Beispiel: "rechn" + "n" → "rechnen".

Siehe auch

Morphologie (Sprache)

Literatur

  • K.-U. Carstensen et al. (2004): Computerlinguistik und Sprachtechnologie. Kapitel 3.1, 3.2.
  • D. Jurafsky & J.H. Martin (2000): Speech and Language Processing. Prentice Hall.

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Linguistik — Sprachwissenschaft * * * Lin|gu|ịs|tik 〈f.; ; unz.〉 Sprachwissenschaft * * * Lin|gu|ịs|tik, die; [als Bez. für die moderne Sprachwiss. (frz. linguistique) eingef. von dem Schweizer Sprachwissenschaftler F. de Saussure (1857–1913)]:… …   Universal-Lexikon

  • Synkretismus (Linguistik) — Synkretismus ist das Zusammenfallen von Beugungsformen, im Deutschen beispielsweise dieselbe Endung bei verschiedenen Kasus. Synkretismen kommen vor allem in der indogermanischen Sprachfamilie vor. Morphologisch ausgedrückt sind Synkretismen… …   Deutsch Wikipedia

  • Übersetzung (Linguistik) — Unter Übersetzung versteht man in der Sprachwissenschaft: die Übertragung eines (meist schriftlich) fixierten Textes von einer Ausgangssprache in eine Zielsprache; sie wird auch als „Übersetzen“ bezeichnet. das Ergebnis dieses Vorgangs. Zur… …   Deutsch Wikipedia

  • Morphologie (Linguistik) — Unter Morphologie (auch: Morphematik oder Morphemik) versteht man in der Sprachwissenschaft ein Teilgebiet der Grammatik. Die Morphologie befasst sich mit der inneren Struktur von Wörtern und widmet sich der Erforschung der kleinsten bedeutungs… …   Deutsch Wikipedia

  • Computerlinguistik — In der Computerlinguistik wird untersucht, wie natürliche Sprache in der Form von Text oder Sprachdaten mit Hilfe des Computers algorithmisch verarbeitet werden kann. Sie ist Teilbereich der künstlichen Intelligenz und gleichzeitig Schnittstelle… …   Deutsch Wikipedia

  • Silbenfuge — Als Silbengrenze, Silbenfuge oder Silbenjunktur bezeichnet man die Grenze zwischen zwei benachbarten Silben. Die Silbengrenze markiert zugleich das Silbenende der ersten und den Silbenanfang der zweiten Silbe. Die Bestimmung der Silbengrenzen… …   Deutsch Wikipedia

  • Silbenjunktur — Als Silbengrenze, Silbenfuge oder Silbenjunktur bezeichnet man die Grenze zwischen zwei benachbarten Silben. Die Silbengrenze markiert zugleich das Silbenende der ersten und den Silbenanfang der zweiten Silbe. Die Bestimmung der Silbengrenzen… …   Deutsch Wikipedia

  • Text-Mining — Der Begriff Text Mining (engl. für „Textschürfen“) bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text Mining Software aus Texten Informationen, die die… …   Deutsch Wikipedia

  • Textmining — Der Begriff Text Mining (engl. für „Textschürfen“) bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text Mining Software aus Texten Informationen, die die… …   Deutsch Wikipedia

  • Textschürfung — Der Begriff Text Mining (engl. für „Textschürfen“) bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text Mining Software aus Texten Informationen, die die… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”