Bei der Spracherkennung geht es darum, dass der PC Wörter und Sätze, die der Anwender in ein Mikrofon spricht, erkennt und in eine Textverarbeitung einfügt. Ein zweiter Anwendungsbereich ist die Steuerung des Betriebssystems und von Anwendungen durch gesprochene Kommandos.
Spracherkennungs-Programme arbeiten ähnlich wie der menschliche Hörvorgang, bei dem das Ohr Laute in Form von Schwingungen aufnimmt, das Gehirn die Signale decodiert und deren Bedeutung bestimmt.
Die Software wandelt das eingehende akustische Signal in Echtzeit in ein für sie geeignetes Format und beginnt dann nach den besten Entsprechungen für die gesprochenen Wörter zu suchen. Hierbei berücksichtigt das Programm die ihm bekannten Wörter und Sätze, die Grammatik und den Kontext des bisher diktierten Textes. Sobald die Entsprechung mit der größten Wahrscheinlichkeit gefunden wurde, wird die erkannte Einheit in die gewünschte Textverarbeitung ausgegeben.
Mitte der 90er-Jahre musste man noch Wort für Wort diktieren und das Programm durch mehrstündiges Probesprechen von vorgegebenen Sätzen an die eigene Stimme gewöhnen. Das ist heute passé. Das Programm
Dragon Naturally Speaking wirbt in Version 9 mit einer 99-prozentigen Erkennungsgenauigkeit ohne Anlernen - und das bei flüssiger Sprechweise.
Der Preis der Standard-Version beträgt 99 Euro inklusive Headset. Da 99 Prozent Genauigkeit bei einer typischen Seite mit 500 Wörtern immer noch 5 falsche Wörter bedeuten, lernt das Programm bei jedem Diktat hinzu. Dadurch steigt die Erkennungsrate kontinuierlich.
In Windows Vista ist eine Spracherkennungs-Funktion zum Steuern und Diktieren integriert. Sie kommt aber weder vom Funktionsumfang noch von der Erkennungsrate her an eigenständige Produkte wie Dragon Naturally Speaking heran. Sie aktivieren sie über "Zubehör, Erleichterte Bedienung, Windows Spracherkennung".
Es erscheint ein Assistent, über den Sie das Mikrofon einrichten, das Tool trainieren und nebenbei die wichtigsten Funktionen kennen lernen. Das dauert etwa 20 Minuten. Danach sehen Sie auf dem Desktop ein Kontrollfenster. Für ein zusätzliches Training klicken Sie hier im Kontextmenü auf „Konfiguration, Spracherkennung verbessern" und folgen den Anweisungen des Assistenten. Dadurch lässt sich die Fehlerrate nach und nach verringern.
Während sich Spracherkennung zum Diktieren von langen Texten noch nicht auf breiter Front durchgesetzt hat, spielt sie eine immer größere Rolle bei mobilen Geräten, die über keine (vollständige) Tastatur verfügen. Navigationsgeräte-Hersteller Tomtom hat seine Modell GO 720 und GO 920 mit Spracherkennung des Herstellers Nuance für die Zieleingabe per Stimme ausgerüstet.
Auch bei automatischen Telefondialogen begegnet Anwendern Spracherkennung - und das häufiger, als manchem lieb sein dürfte. Denn nicht jeder spricht gerne mit einem Automaten. In Zeiten knapper Kassen und Rationalisierung stellt diese Technik für Unternehmen aber häufig die einzige Möglichkeit dar, bestimmte Dienste kostengünstig anzubieten. Die Bahn-Auskunft unter der kostenlosen Nummer 0800/1507090 ist ein gutes Beispiel für Spracherkennung am Telefon.
Lesen Sie auf der nächsten Seite:
Lesen Sie in diesem Beitrag