Sprachstatistik


Sprachstatistik

Sprachstatistik kann auf zweierlei Weise verstanden werden: Einerseits als die Statistik der Sprachen [1], andererseits als jede Art statistischer Untersuchung beliebiger sprachlicher Eigenschaften oder Gegenstände und ihrer Veränderungen. Im zweiten Sinn ist sie auch als Statistische Linguistik oder Linguostatistik bekannt. Noch weiter gespannte Ziele verfolgt die Quantitative Linguistik, nämlich eine Sprachtheorie zu entwickeln, zu der beispielsweise das Menzerathsche Gesetz und das Zipfsche Gesetz gehören.

Inhaltsverzeichnis

Aufgaben und Ziele der Sprachstatistik

Sprachstatistische Erhebungen dienen in vielen Fällen praktischen oder auch wissenschaftlichen Zwecken. Wenn man zum Beispiel weiß, wie häufig Buchstaben in einer Sprache vorkommen, kann man verschlüsselte Texte lesbar machen. Bei stilistischen Untersuchungen (Quantitative Stilistik) geht es darum, Besonderheiten des Sprachgebrauchs einzelner Autoren, Textklassen, Epochen oder verschiedener Kommunikationsbereiche (wie den Stil der Presse und Publizistik oder der Alltagssprache) zu charakterisieren. Wendet man statistische Methoden auf literarische Texte an, so betreibt man nach einem Vorschlag von Fucks (1968: 77, 88) Quantitative Literaturwissenschaft. Die Möglichkeiten der Statistik bei Stiluntersuchungen skizziert Crystal (1993: 67). Auch für die Feststellung, wie schwierig ein Text gestaltet ist, kann die Sprachstatistik wesentliche Hilfe leisten. So dienen die Lesbarkeitsindizes dazu, die Lesbarkeit, das heißt den Schwierigkeitsgrad von Texten, zu messen. Auch der Wortschatz der Sprachen ist unter dem Begriff Lexikostatistik in vielfältiger Weise Gegenstand der Sprachstatistik: Hier geht es unter anderem um die Erstellung von Häufigkeitswörterbüchern und um die Verfallsraten, denen der Wortschatz unterliegt (Glottochronologie). Die Inhaltsanalyse bedient sich quantitativer Verfahren (Quantitative Inhaltsanalyse), um herauszufinden, welche Themen eine wie große Beachtung finden. [2]

Ganz praktischen Zwecken diente auch die Stichometrie in der Antike: Zum Beispiel wurden Textlängen bestimmt, um eine Grundlage für die Abrechnung des Schreiberlohns zu haben. [3]

Es gibt also viele Einsatzmöglichkeiten für die Sprachstatistik. Oft geht es aber auch nur um die Befriedigung der Neugier: Man will einfach wissen, was wie häufig vorkommt oder wie seine Häufigkeiten sich mit der Zeit ändern, ohne dass damit unmittelbar weitergehende Ziele verfolgt werden.

Sprachstatistik des Deutschen

Zur Sprachstatistik des Deutschen: Vielfältige Übersichten zur Sprachstatistik des Deutschen (Buchstaben- und Lauthäufigkeiten, Grammatik, Wortschatz) findet man bei Meier (1967). Etliche Daten zum Deutschen und seinen Entwicklungstendenzen enthalten die entsprechenden Werke von Braun (1998)[4] und Sommerfeldt (1988).[5] Einige Daten stellen auch König (2005)[6] und Duden. Die deutsche Rechtschreibung (2009)[7] zusammen. Zu vielen Themen finden sich in Untersuchungen zur Quantitativen Linguistik ebenfalls statistische Daten zum Deutschen.[8]

Statistische Grundlagen

Statistische (und z.T. wissenschaftstheoretische) Grundlagen für Linguisten stellen Altmann (1995), von Essen (1979), Hoffmann & Piotrowski (1979), Nikitopoulos (1973) und Schlobinski (1996) für unterschiedliche Ansprüche dar.

Literatur

  • Gabriel Altmann: Statistik für Linguisten. Wissenschaftlicher Verlag Trier, Trier 1995. ISBN 3-88476-176-5.
  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarb. u. ergänzte Aufl. Peust & Gutschmidt, Göttingen 2006. ISBN 3-933043-17-4.
  • Peter Braun: Tendenzen in der deutschen Gegenwartssprache. Sprachvarietäten. 4. Auflage. Kohlhammer, Stuttgart/ Berlin/ Köln 1998, S. 103. ISBN 3-17-015415-X. Das Buch enthält statistische Angaben zu vielen sprachlichen Merkmalen des Deutschen.
  • David Crystal: Die Cambridge Enzyklopädie der Sprache. Übersetzung und Bearbeitung der deutschen Ausgabe von Stefan Röhrich, Ariane Böckler und Manfred Jansen. Campus Verlag, Frankfurt/ New York 1993. ISBN 3-593-34824-1.
  • Otto von Essen: Allgemeine und angewandte Phonetik. 5., neubearbeitete und erweiterte Auflage. Akademie-Verlag, Berlin 1979.
  • Wilhelm Fucks: Nach allen Regeln der Kunst. Diagnosen über Literatur, Musik, bildende Kunst - die Werke, ihre Autoren und Schöpfer. Deutsche Verlags-Anstalt, Stuttgart 1968.
  • Lothar Hoffmann & Rajmund G. Piotrowski: Beiträge zur Sprachstatistik. VEB Verlag Enzyklopädie, Leipzig 1979.
  • Emmerich Kelih: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6. (Zugleich Dissertation Graz, 2007. Ausführliche Darstellung des Beitrags der russischen Sprach- und Literaturwissenschaft von der Mitte des 19. Jahrhunderts an, die für die Entwicklung der quantitativen/statistischen Linguistik und Literaturwissenschaft besonders wichtig ist.)
  • Sebastian Kempgen: Russische Sprachstatistik. Systematischer Überblick und Bibliographie. Sagner, München: 1995. ISBN 3-87690-617-2.
  • Reinhard Köhler: Bibliography of quantitative linguistics. John Benjamins, Amsterdam 1995, ISBN 90-272-3751-4.
  • Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/N.Y. 2005, ISBN 3-11-015578-8.
  • Helmut Meier: Deutsche Sprachstatistik. 2., erw. u. verb. Aufl. Olms, Hildesheim 1967, 1978, ISBN 3-487-00735-5. (1. Aufl. 1964)
  • Charles Muller: Einführung in die Sprachstatistik. Hueber, München 1972.
  • Pantelis Nikitopoulos: Sprachstatistik. In: Hans Peter Althaus, Helmut Henne, Herbert Ernst Wiegand (Hrsg.): Lexikon der germanistischen Linguistik. 2., vollständig neu bearbeitete und erweiterte Auflage. Niemeyer, Tübingen 1980, S. 792-797.ISBN 3-484-10392-2.
  • Pantelis Nikitopoulos: Statistik für Linguisten. Ein methodischer Beitrag. Narr, Tübingen 1973.
  • Peter Schlobinski: Empirische Sprachwissenschaft. Westdeutscher Verlag, Opladen 1996. ISBN 3-531-22174-4.

Einzelnachweise

  1. etliche Daten dazu in: Wolfgang Viereck, Karin Viereck, Heinrich Ramisch: dtv-Atlas Englische Sprache. Deutscher Taschenbuch Verlag, München 2002. S. 236, passim. ISBN 3-423-03239-1 und http://wwwuser.gwdg.de/~kbest/einfueh.htm
  2. Klaus Merten: Inhaltsanalyse. Einführung in Theorie, Methode und Praxis. 2. verbesserte Auflage. Opladen: Westdeutscher Verlag 1993. ISBN 3-531-11442-5
  3. Gero von Wilpert: Sachwörterbuch der Literatur. 8., verbesserte und erweiterte Auflage. Kröner, Stuttgart 2001. ISBN 3-520-23108-5
  4. Peter Braun: Tendenzen in der deutschen Gegenwartssprache. Sprachvarietäten. 4. Auflage. Kohlhammer, Stuttgart/ Berlin/ Köln 1998, passim. ISBN 3-17-015415-X.
  5. Karl-Ernst Sommerfeldt (Hrsg.): Entwicklungstendenzen in der deutschen Gegenwartssprache. VEB Bibliographisches Institut, Leipzig 1988, S. 193 - 243. ISBN 3-323-00169-9.
  6. Werner König: dtv-Atlas Deutsche Sprache. 15. durchgesehene und aktualisierte Auflage. dtv, München 2005, 114-119. ISBN 3-423-03025-9
  7. Duden. Die deutsche Rechtschreibung. 25., völlig neu bearbeitete und erweiterte Auflage. Dudenverlag, Mannheim/Wien/Zürich 2009, S. 155-165.ISBN 978-3-411-04015-5.
  8. Vgl. http://wwwuser.gwdg.de/~kbest/einfueh.htm

Siehe auch


Weblinks

Wiktionary Wiktionary: Sprachstatistik – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Sprachstatistik — Sprachstatistik,   Erforschung von Sprache, bei der sprachlichen Regularitäten unter statistischem Aspekt analysiert und Angaben zur Auftretenswahrscheinlichkeit sprachlicher Phänomene gemacht werden. Sprachstatistische Untersuchungen werden u. a …   Universal-Lexikon

  • Sprachstatistik — Sprach|sta|tis|tik …   Die deutsche Rechtschreibung

  • Lexikometrie — Lexikostatistik (auch: Lexikometrie) ist der Bereich der Sprachstatistik, der sich mit statistischen Untersuchungen des Wortschatzes von Sprachen befasst. Inhaltsverzeichnis 1 Lexikostatistik als Teilbereich der Sprachstatistik 2 Themengebiete… …   Deutsch Wikipedia

  • Lexikostatistik — (auch: Lexikometrie) ist der Bereich der Sprachstatistik, der sich mit statistischen Untersuchungen des Wortschatzes von Sprachen befasst. Inhaltsverzeichnis 1 Lexikostatistik als Teilbereich der Sprachstatistik 2 Themengebiete der… …   Deutsch Wikipedia

  • Helmut Meier — (* 20. Dezember 1897 in Broitzem, heute Stadtteil von Braunschweig; † 30. Juli 1973 in Braunschweig) war ein deutscher Lehrer und Germanist. Helmut Meier besuchte 1912 19 das Lehrerseminar in Braunschweig und nahm 1917/18 als Soldat am 1.… …   Deutsch Wikipedia

  • Quantitative Linguistik — Die Quantitative Linguistik (auch: Statistische Linguistik; engl. Quantitative Linguistics, Statistical Linguistics) ist eine Disziplin der Mathematischen Linguistik und damit der allgemeinen Linguistik bzw. Sprachwissenschaft insgesamt.… …   Deutsch Wikipedia

  • Charles Muller (Romanist) — Charles Muller (* 22. September 1909) ist ein französischer Romanist und Sprachpfleger. Inhaltsverzeichnis 1 Leben und Werk 2 Weitere Werke 2.1 Sprachstatistik 2.2 …   Deutsch Wikipedia

  • Frequenzwörterbuch — Frequenzwörterbücher (auch: Häufigkeitswörterbücher) geben den Wortschatz einer Sprache, eines Autors, einer Textsorte etc. wieder, wobei die Häufigkeit, mit der die einzelnen Wörter in einem Text oder Textkorpus vorkommen, das wichtigste Ziel… …   Deutsch Wikipedia

  • Häufigkeitswörterbuch — Frequenzwörterbücher (auch: Häufigkeitswörterbücher) geben den Wortschatz einer Sprache, eines Autors, einer Textsorte etc. wieder, wobei die Häufigkeit, mit der die einzelnen Wörter in einem Text oder Textkorpus vorkommen, das wichtigste Ziel… …   Deutsch Wikipedia

  • Häufigste Wörter — Die Liste der häufigsten Wörter der deutschen Sprache beruht auf statistischen Auswertungen von Publikationen in Deutscher Sprache. Eine Auszählung von rund 11 Mio. Wörtern ergab, dass nur 207 Wortformen nach ihrer Häufigkeit über 50 Prozent der… …   Deutsch Wikipedia