Bidirektionaler Text

Bidirektionaler Text

Bidirektionale Texte sind meist mehrsprachige Texte, in denen Schriften mit verschiedener Schreibrichtung verwendet werden. Dies stellt vor allem in der Informations- und Computertechnik seit dem weltweiten Datenaustausch durch das Internet ein Problem dar.

Inhaltsverzeichnis

Schriften mit verschiedenen Schreibrichtungen

In verschiedenen Sprachen werden unterschiedliche Schreibsysteme verwendet. In Europa und in europäisch beeinflussten Kulturen sind vorwiegend Schriften mit einer Schreibrichtung von links nach rechts gebräuchlich, beispielsweise in Latein, Deutsch oder Englisch. Andere, besonders semitische Schriften, wie etwa die hebräische, arabische oder persische und davon beeinflusste Schriften wie Thaana und Kharoshthi, werden von rechts nach links geschrieben. Es gibt aber auch Schriften, die sowohl von rechts nach links als auch umgekehrt geschrieben werden, wie es zum Beispiel mit ägyptischen Hieroglyphen oder Chinesischen Schriftzeichen möglich ist.

Bidirektionale Texte in Computersystemen

Ob Ihr Browser den hebräischen Text
auf dieser Seite korrekt darstellt,
können Sie hier sehen.

Hebräisch für "Garten Eden"

גן עדן

Der Text (rechts) sollte etwa so
aussehen wie das Bild (links)

Bidirektionale Schreibunterstützung (Bidirectional script support, BiDi oder bidi) ist die Möglichkeit, mit Computersystemen komplexe Texte in verschiedenen Schreibrichtungen zu verfassen. In älteren Systemen wurde meist nur eine Schreibrichtung, oft von links nach rechts, unterstützt. Durch die Verbreitung der Computertechnik über die gesamte Welt und damit kulturübergreifend müssen Texteditoren und andere Textverarbeitungssysteme beide Schreibrichtungen verarbeiten können.

Manche Computerprogramme können bidirektionalen Text nicht richtig anzeigen. So sollte die hebräische Bezeichnung für den Garten Eden (גן עדן) von rechts nach links (gimel (ג), nun (ן), ajin (ע), daleth (ד), nun (ן)) buchstabiert werden.

Vor allem bei Mischtexten, in denen verschiedene Schriften innerhalb eines Absatzes verwendet werden, haben Computersysteme noch heute Darstellungsprobleme.

Unicode

In Unicode werden mehrere Schriftsysteme dargestellt, wobei jedem Buchstaben seine Schreibrichtung zugeordnet wird; Satzzeichen haben hingegen keine festgelegte Schreibrichtung. Zeichen mit einer festgelegten Schreibrichtung heißen „strong characters“; Zeichen, die in verschiedenen Schreibrichtungen verwendet werden können, heißen „weak characters“. Der Unicodestandard legt dabei nicht fest, wie mit „weak characters“ umgegangen werden muss, es gibt aber verschiedene Algorithmen, welche versuchen, eine passende Schreibrichtung für die Satzzeichen zu finden.

Ein Beispiel für einen solchen Algorithmus: Steht ein „weak character“ zwischen zwei „strong characters“ mit der gleichen Schreibrichtung, so erbt es die Schreibrichtung. Steht es hingegen zwischen zwei „strong characters“ mit unterschiedlicher Schreibrichtung, wird die Hauptschreibrichtung des Textes übernommen. Steht ein „weak character“ zwischen anderen „weak characters“, wird versucht, die Schreibrichtung des nächstgelegenen „strong characters“ zu ermitteln. Um dieses Verhalten zu beeinflussen, gibt es die „pseudo-strong characters“ (U+200E LTR und U+200F RTL), auch „marks“ genannt. Diese Zeichen werden nicht gedruckt, verhalten sich aber wie ein entsprechender „strong character“ zur Ermittlung der Schreibrichtung für ein Satzzeichen.

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Complex Text Layout — Als Complex Text Layout wird in Computerprogrammen die Darstellung von Schriftsystemen bezeichnet, die nicht der Links nach rechts Anordnung der westlichen Sprachen folgen. Es gibt mehrere Arten komplexer Schriftsysteme: Rechts nach links… …   Deutsch Wikipedia

  • Abkürzungen/Computer — Dies ist eine Liste technischer Abkürzungen, die im IT Bereich verwendet werden. A [nach oben] AA Antialiasing AAA authentication, authorization and accounting, siehe Triple A System AAC Advanced Audio Coding AACS …   Deutsch Wikipedia

  • Liste der Abkürzungen (Computer) — Dies ist eine Liste technischer Abkürzungen, die im IT Bereich verwendet werden. A [nach oben] AA Antialiasing AAA authentication, authorization and accounting, siehe Triple A System AAC Advanced Audio Coding AACS …   Deutsch Wikipedia

  • I18N — Internationalisierung bedeutet in der Informatik bzw. in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann. Internationalisierung… …   Deutsch Wikipedia

  • I18n — Internationalisierung bedeutet in der Informatik bzw. in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann. Internationalisierung… …   Deutsch Wikipedia

  • Internationalisierung (Informatik) — Internationalisierung bedeutet in der Informatik bzw. in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann. Internationalisierung… …   Deutsch Wikipedia

  • Internationalisierung (Software) — Internationalisierung bedeutet in der Informatik bzw. in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann. Internationalisierung… …   Deutsch Wikipedia

  • L18N — Internationalisierung bedeutet in der Informatik bzw. in der Softwareentwicklung, ein Programm so zu gestalten, dass es leicht (ohne den Quellcode ändern zu müssen) an andere Sprachen und Kulturen angepasst werden kann. Internationalisierung… …   Deutsch Wikipedia

  • Beedies — Dieser Artikel behandelt die indische Rauchware namens Bidi. Für die Abkürzung BiDi aus der Computertechnik siehe Bidirektionaler Text Bidi Bidi Bidi (hindi: बीड़ी …   Deutsch Wikipedia

  • RTL (Begriffsklärung) — RTL steht für: RTL Group, ein europäischer Rundfunkkonzern RTL Television, deutscher Fernsehsender mit Sitz in Köln, der zur RTL Gruppe gehört RTL (Frankreich), französischer Radiosender mit Sitz in Paris, der zur RTL Gruppe gehört 104.6 RTL,… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”