Beim Thema Sprachausgabe denken viele noch an monotone roboterartige Stimmen, die auch deutsche Texte mit englischem Slang vorlesen. Die Technik, in der Fachsprache Sprachsynthese genannt, hat sich inzwischen weiterentwickelt: Sie nähert sich immer weiter der natürlichen Sprechweise an.
Grundlage dafür bilden menschliche Sprecher. Diese werden von den Herstellern der Sprachausgabe-Software beauftragt, vorgegebene Texte im Studio einzusprechen. Das Audio-Material wird dann von Software-Entwicklern in einzelne Teile zerlegt. Das können Einzel- oder Doppellaute sein, manchmal auch ganze Silben.
Denn ein und derselbe Buchstabe wird nicht immer gleich ausgesprochen, häufig gibt es sogar im gleichen Wort unterschiedliche Varianten. So klingen die beiden "e" im Wort "Preisgestaltung" zum Beispiel völlig unterschiedlich. Die Audioschnipsel werden kategorisiert und in die Software integriert.
Vor dem Vorlesen muss eine gute Sprachsynthese-Software ein gewisses Maß an künstlicher Intelligenz an den Tag legen. Jeden Satz analysiert sie akribisch. Im ersten Schritt sucht sie nach Abkürzungen und Zahlen und löst diese auf. Aus "etc." wird "etcetera", aus "2004" wird "zweitausendvier". Schwieriger wird es bei der Zahl "1", die je nach Kontext "ein", "eine" oder "eins" ausgesprochen wird. Gleiches gilt für Abkürzungen wie "tgl.", die zum Beispiel "täglich", "täglicher" oder "tägliches" bedeuten können.
Durch die intelligente Satzanalyse erschließt sich die Software den Zusammenhang. Das ist auch nötig, um abhängig vom Kontext die richtige Betonung einzelner Buchstaben im Wort und der Wörter im Satz zu treffen.
Zum Vorlesen greifen manche Programme auf ein umfangreiches Lexikon zurück, in dem die Aussprache jedes Wortes definiert ist. Bei unbekannten Wörtern kommt eine Sammlung von allgemeinen Ausspracheregeln zum Einsatz. Andere Programme gehen den umgekehrten Weg: Sie setzen auf eine sehr ausgeklügelte Liste mit Ausspracheregeln und fangen nur die Ausnahmen in einem Wörterbuch ab.
Erst, wenn das Programm mit seiner Wort- und Satzanalyse durch ist, holt es sich die jeweils passenden Audio-Schnipsel aus seinem Fundus und fügt sie zu einem flüssig gesprochenen Satz zusammen. Da die Software bereits während des Vorlesens die folgenden Sätze analysiert merken Sie in der Praxis keine Zeitverzögerung.
Ein Beispiel für eine leistungsfähige Sprachausgabe-Software ist
Voice Reader Home. Da jede Sprache ihre Eigenheiten hat, gibt es das Programm in 11 Versionen. Sie können die
Qualität der Sprachausgabe testen, indem Sie sich kurze Texte vorlesen lassen.
Eine Alternative ist das Programm
Natural Reader. Auch hier haben Sie die Wahl zwischen Sprechern aus verschiedenen Ländern. Es gibt auch eine kostenlose Version (9,4 MB). Diese setzt aber auf einen synthetischen, englischsprachigen Sprecher und liefert bei deutschsprachigen Texten keine brauchbaren Ergebnisse.
Lesen Sie auf der nächsten Seite:
Lesen Sie in diesem Beitrag