Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität


Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität

Das Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität sagt aus, dass Schriftzeichen verschiedener Komplexitätsgrade in Texten gemäß einem theoretisch begründbaren Sprachgesetz verwendet werden.

Inhaltsverzeichnis

Komplexität von Schriftzeichen

Schaut man sich geschriebene Texte an, so ist deutlich, dass Schriftzeichen wie etwa das <o> relativ einfach oder wie das <m> recht komplex gestaltet sein können, wenn man als Kriterium für die Komplexität zum Beispiel die Zahl der Richtungsänderungen im Verlauf den Schriftzeichens annimmt. Deutlicher als in der lateinischen Schrift sind die Unterschiede jedoch in der chinesischen oder der japanischen Schrift. In beiden Fällen kann als Kriterium die Zahl der Striche, aus denen die einzelnen Schriftzeichen bestehen, gewählt werden. Im Falle der chinesischen Schrift kann stattdessen auch die Zahl der Komponenten pro Schriftzeichen ausgezählt werden.

Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität

Das Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität besagt nun, dass Schriftzeichen, die aus unterschiedlichen Mengen von Strichen oder Komponenten bestehen, in Texten nicht chaotisch, sondern gesetzmäßig verteilt sind. Es handelt sich dabei im Prinzip um das gleiche Sprachgesetz, das die Quantitative Linguistik besonders für die Häufigkeitsverteilung der Wortlängen entwickelt hat (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a. [1]).

Verteilung der Schriftzeichen im Chinesischen

Untersuchungen zur Verteilung von Schriftzeichen unterschiedlicher Komplexität im Chinesischen wurden auf zweierlei Art durchgeführt:

  • die Komplexität der Schriftzeichen wurde durch die Zahl der Striche bestimmt[2]; in diesem Fall konnte an 20 Einzeltexte die 1-verschobene Binomialverteilung als Modell mit guten Ergebnissen angepasst werden. Die Schriftzeichen wurden so zusammengefasst, dass die erste Klasse aus 1-3, die zweite aus 4-6 Strichen undsoweiter bestanden.
  • die Komplexität der Schriftzeichen wurde durch die Zahl ihrer Komponenten bestimmt; die Komponenten setzen sich ihrerseits aus unterschiedlich vielen Strichen zusammen. Bei einer Menge von über 5000 Schriftzeichen erwies sich die 1-verschobene Dacey-Poisson-Verteilung als ein geeignetes Modell.[3]

Verteilung der Schriftzeichen im Japanischen

Ein Beispiel für die Verteilung von Schriftzeichen im Japanischen (gemessen als Zahl der Striche pro Kanji-Schriftzeichen) in einem Wörterbuchausschnitt hat Sanada erarbeitet[4]:

x
n(x)
NP(x)
1
4
2.91
2
66
78.47
3
368
358.89
4
594
580.85
5
438
449.87
6
200
196.71
7
55
53.91
8
5
9.96
9
3
1.44

(Dabei ist x: Zahl der Striche pro Kanji-Zeichen, n(x) die in diesem Text beobachtete Zahl der Striche pro Kanji-Zeichen; NP(x) die Zahl der Striche pro Kanji-Zeichen, die berechnet wird, wenn man die Conway-Maxwell-Poisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: die Conway-Maxwell-Poisson-Verteilung ist für Wortschatzausschnitt ein gutes Modell mit dem Testkriterium P = 0.28, wobei P als gut erachtet wird, wenn es größer/ gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)

Ein allgemeines Sprachgesetz

Mit diesen Untersuchungen, die noch nicht sehr reichhaltig sind, deutet sich an, dass auch für die Schriftzeichen unterschiedlicher Komplexität im Prinzip die gleichen Gesetzmäßigkeiten gelten, die auch schon für die gut erforschten Wortlängen und etliche andere Sprachgrößen gelten. Siehe dazu auch:

Literatur

  • Gabriel Altmann, Fan Fengxiang (Hrsg.): Analyses of Script. Properties of Characters and Writing Systems. Mouton de Gruyter, Berlin/New York 2008. Die Beiträge des Buches geben einen Überblick über Fragestellungen, mit denen die Quantitative Linguistik die Schriftsysteme zu erfassen sucht, darunter finden sich auch mehrere Versuche, Gesetzmäßigkeiten der Graphemkomplexität/Graphemlänge nachzuweisen.

Einzelnachweise

  1. Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106
  2. Xiaoli Yu: Zur Komplexität chinesischer Schriftzeichen. In: Göttinger Beiträge zur Sprachwissenschaft 5, 2001, S. 121-129.
  3. Hartmut Bohn: Quantitative Untersuchungen der modernen chinesischen Sprache und Schrift. Verlag Dr. Kovač, Hamburg 1998, S. 55f. ISBN 3-86064-672-9.
  4. Haruko Sanada: Investigations in Japanese Historical Lexicology (Revised Edition). Peust & Gutschmidt, Göttingen 2008, S. 100f. ISBN 978-3-933043-12-2.

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Gesetz der Verteilung von Satzlängen — Das Gesetz der Verteilung von Satzlängen behandelt die Frage, wie oft Sätze verschiedener Komplexität in Texten verwendet werden. Ein besonders einfaches Kriterium für Satzkomplexität ist ihre Länge, die verschieden definiert werden kann: als die …   Deutsch Wikipedia

  • Quantitative Linguistik — Die Quantitative Linguistik (auch: Statistische Linguistik; engl. Quantitative Linguistics, Statistical Linguistics) ist eine Disziplin der Mathematischen Linguistik und damit der allgemeinen Linguistik bzw. Sprachwissenschaft insgesamt.… …   Deutsch Wikipedia