Apple hat es wieder einmal vorgemacht: Die Spracherkennung Siri hat viel Lob eingeheimst. Das iPhone 4S versteht rund 80 bis 90 Prozent der Befehle und reagiert in den meisten Fällen richtig – egal, ob die Spracherkennung nun eine Frage zum Terminkalender oder zum Sinn des Lebens beantworten oder eine SMS schreiben soll. Kein Wunder, dass so mancher Android-Nutzer neidisch wird. Doch auch für Android gibt es zwei verheißungsvolle Spracherkennung-Apps, die wir uns näher angesehen haben.
Prinzipiell funktioniert Spracherkennung folgendermaßen: Die Spracheingaben werden via Mobilfunknetz oder WLAN an einen Spracherkennungs-Server gesendet. Dieser interpretiert die Audio-Information und wandelt sie in Text um. Dazu muss die Software erst einmal die Sätze in einzelne Wörter zerlegen. Im nächsten Schritt vergleicht sie die Wort-Einzelteile mit einer Datenbank für Klangmuster. Nun versucht die Spracherkennung anhand von Wahrscheinlichkeits- und Relevanz-Algorithmen herauszufinden, was der Sprecher gemeint haben könnte. Eine gute Spracherkennung steht und fällt also mit einer gut gefütterten Datenbank und der Qualität der künstlichen Intelligenz. Die Siri-Datenbank ist beispielsweise vor allem mit hochdeutschen Klangmustern gefüttert. Bei Dialekten tut sich Siri daher schwer, die Erkennungsquote sinkt gegen Null.
Ausblick: Android im Jahr 2012 mit Siri?
Außerdem bevorzugen Spracherkennungssysteme kurze, unkomplizierte Sätze. Mit Schachtelsätzen sind sie oft überfordert. Auch Ironie kann die Maschinenlogik nicht interpretieren. Doch das ist ja auch nicht nötig, wenn Sie Siri nur als erweiterte Sprachsteuerung und nicht als Gesprächspartner nutzen wollen.
Im Android Market gibt es zwei Apps, die darauf abzielen, es mit Siri aufzunehmen: Vlingo und Aivc. Wir haben sie einem Test unterzogen.
Siri für Android mit Vlingo?

Das gut strukturierte Hauptmenü der Gratis-App Vlingo zeigt alle Funktionen auf einen Blick. Sie haben zum Beispiel die Möglichkeit, per Spracheingabe eine SMS zu verfassen oder etwas via Google im Internet zu suchen. Das klingt dann so: “SMS an Chef Komme 10 Minuten später” oder “Google – Finde einen Autoverleih”. Auch Facebook, einen Anruf oder die Routenplanung können Sie damit starten.
Die Spracheingaben werden an den Vlingo-Server gesendet, der das Gesprochene in Text umwandelt. Den erkannten Text sendet der Server auf Ihr Smartphone-Display zurück. So können Sie kontrollieren, ob der Server Sie richtig verstanden hat.
Die Frage nach dem Wetter vor Ort beantwortet Vlingo schlecht. Auf die Frage „Wie ist das Wetter heute?“ werden Ihnen via Google wetter.de, wetter.com und andere Wetterdienste empfohlen. Auch wenn Sie den Ort angeben und das Widget Accuweather auf Ihrem Smartphone installiert ist, schickt Vlingo Sie ins Internet. Eine direkte Antwort erhalten Sie nicht. Die Wünsche „Wecker Stellen“ oder „Termine vorlesen“ konnte Vlingo im Test ebenfalls nicht erfüllen.

Im Dialekt-Test hat sich Vlingo bei dem Befehl „Facebook-Aktualisierung „Gä ma mol“ wacker geschlagen und „Geh ma mal“ erkannt. Doch hundertprozentig sollte man sich auf die Dialekt-Erkennung nicht verlassen: „Kummst heit?“ (Hochdeutsch: Kommst du heute?) wurde nämlich zu „Kommst kommst“.
Sehr wacker geschlagen hat sich das System wiederum bei unserem leicht verschachtelten Test-Zitat von Goethe: „Auch aus Steinen, die einem in den Weg gelegt werden, kann man Schönes bauen.“ Hier erkannte Vlingo „Aus Steinen die einem in den Weg gelegt werden kann man schönes bauen. Das bedeutet fast hundert Prozent Trefferquote, nur mit der Kommasetzung haperte es.
Praktisch: Vlingo bietet einen „Safe Reader Modus“. Damit können Sie sich im Auto mit festem Blick auf die Straße SMS vorlesen lassen.
Fazit: Vlingo kennt zwar weniger Befehle als die Sprachsteuerung Siri von Apple. Die Trefferquote ist jedoch erstaunlich hoch – von kleineren “Hörfehlern” einmal abgesehen. Dafür sorgt eine Sprachmuster-Datenbank, die Vlingo sorgfältig pflegt. Sie enthält nicht nur hochdeutsche Worte, sondern sammelt auch Dialektausdrücke und schwierige Namen. Zudem passt sich Vlingo an die Stimme und das Vokabular jedes einzelnen Anwenders an.
„Aivc“: Schon eher eine „Siri“ für Android

„Aivc ist Deine persönliche Assistentin. Aivc wird Dir behilflich sein, Sachen schneller und leichter durch Spracheingabe zu erledigen.“ So wirbt YourApp24 für seine kostenlose Spracherkennungs-App Aivc . Bis Anfang des Jahres hieß die App übrigens Alice.
Aivc besitzt eine im Vergleich zu Vlingo äußerst nüchterne Oberfläche, die nur von einem Mikrofon-Symbol geschmückt wird. Tipps für Befehle gibt es nicht, weil Avic die freie Ansprache bevorzugt. Nachdem Sie auf das Mikrofon-Symbol gedrückt haben, sprechen Sie los, wie Ihnen der Mund gewachsen ist.
Aivc kommt Siri schon sehr nahe. Auf die Frage, „Wie ist das Wetter heute?“ antwortet das Programm mit sympathischer Stimme: „Ich habe keine Wetterdaten gefunden.“ Geben Sie Aivc jedoch Hilfestellung und fragen nach dem Wetter in München, zeigt Ihnen Aivc ein Wetter-Widget mit Angaben zum aktuellen Wetter in München plus Drei-Tages-Vorschau.
Auch den Wecker zu programmieren, ist für Avic eine Kleinigkeit. Auf das Kommando „Wecker stellen auf sechs Uhr“ zeigt die App die erkannte Uhrzeit zur Kontrolle an. Wenn Sie auf „Setzen“ tippen, bestätigt Avic im Display sowie akustisch mit einer tiefen, dunklen Stimme “Okay, ich werde Dich um sechs Uhr wecken.“
Schwieriger wird es bei Terminen: Auf die Frage „Termine vorlesen“ weiß Avic nicht genau, was Sie von ihr wollen. Fragen Sie: „Meine Termine Heute?“ antwortet sie: „Erzähl mir mehr über deine Termine heute“ – eine geschickte Konterstrategie, die aber nicht weiterhilft. Auch auf „Was steht heute im Terminkalender“ antwortet Avic ausweichend mit „Darüber muss ich eine Weile nachdenken“. Hier wird deutlich, dass Avic für den Fall, dass sie keine Antwort findet, ein Spektrum an ausweichenden Antworten einprogrammiert hat. Die bieten zwar keine Lösung, sind aber nett zu lesen.
Gar kein Verständnis hat Avic für Dialekte. „SMS an Yvonne – Kummst heit“ wurde zu „SMS an Sylvia – wand kostheim“. Auch „Gä ma mol“ wurde kryptisch interpretiert als „rosen gema“.

Weniger Probleme hat Avic dagegen mit dem Test-Schachtelsatz: „Auch aus Steinen, die einem in den Weg gelegt werden, kann man Schönes bauen.“ Den Satz hat die App korrekt verstanden, allerdings mit dem Nachtrag: „Jetzt habe ich den Faden verloren.“ Also fassen Sie sich besser kurz, wenn Sie mit Avic sprechen. Auch längere Antworten, beispielsweise auf die Frage nach dem Sinn des Lebens, kommen stockend. Hinsichtlich Syntax und Betonungsregeln besteht also noch viel Bedarf an weiterer Entwicklungsarbeit in der Spracherkennung.
Fazit: Avic taugt einigermaßen als virtuelle Assistentin. Sie versteht vieles ausgezeichnet, nur bei Dialekt versagt der Spracherkennungs-Server. Damit ist Avic Vlingo in vielen Punkten überlegen. Denn bei Vlingo muss man sich doch sehr eng an die vorstrukturierten Befehle halten. Wenn Vlingo keine Antwort kennt, schickt Sie die App ins Internet. Avic hat – ähnlich wie Siri – ein paar flotte Sprüche auf den Lippen. Leider versteht sich Avic nicht auf Diktate längerer E-Mails. Und auch das Vorlesen längerer Texte wirkt noch sehr holprig. Memos und Kalendereinträge erstellen oder auslesen kann Avic ebenfalls nicht. Hier ist Siri deutlich weiter! Dennoch ist Avic bis auf leichte Schwächen derzeit eine ausgezeichnete App, die unter Android der iPhone-Siri durchaus das Wasser reichen kann.