Diphon

Diphon

Ein Diphon beschreibt in der konkatenativen Sprachsynthese den kurzen Abschnitt (Baustein) gesprochener Sprache, der in der Mitte eines Phons beginnt und in der Mitte des folgenden Phons endet. Ein Diphon enthält dadurch den durch Koartikulation entstehenden Übergang zwischen den beiden Lauten. Die Verkettung von Bausteinen, die jeweils nur ein Phon umfassen, führt bei der Sprachsynthese nur zu äußerst unbefriedigenden Ergebnissen, da die Koartikulation zwischen den Lauten in diesem Fall nicht berücksichtigt werden kann. Im Gegensatz dazu führt Diphonsynthese bereits zu erstaunlich guten Resultaten, die verständlich und hinreichend natürlich klingen. Die Qualität lässt sich durch die Verwendung längerer Bausteine anstelle von Diphonen (zum Beispiel Silben, häufige Wörter oder Lautfolgen) weiter steigern, was allerdings oft aus Gründen der Inventargröße nicht mehr praktikabel ist.
Die verwendeten Diphonbausteine werden im Verlauf der Synthese zum Beispiel mit Hilfe des PSOLA-Algorithmus in ihren prosodischen Informationen (Stärke, Grundfrequenz, Dauer) manipuliert, um eine natürliche Sprechmelodie zu erzeugen.

Drei Sprachsynthesesysteme, die auf Basis der Diphonsynthese funktionieren, sind DreSS, SVOX und das kostenlose Programm Mbrola.

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • PSOLA — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

  • Sprachausgabe — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

  • Sprachsynthesizer — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

  • Stimmsynthese — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

  • Talkie — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

  • Text-to-Speech — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”