2937

Google Docs konvertiert Text aus Bildern & PDFs

23.06.2010 | 08:55 Uhr |

Google hat seine kostenloses Online-Textverarbeitung um eine spannende Funktion erweitert: Google Texte/Docs konvertiert jetzt auch PDF- und Grafikdateien in Text.

Nicht alles wurde zu Text umgewandelt.
Vergrößern Nicht alles wurde zu Text umgewandelt.
© 2014

Die neue Optical Character Recognition-Funktion (OCR) von Google Texte scannt Bilddateien und PDFs auf darin enthaltenen Text und wandelt diesen dann in das Textformat um. Diese Texte können Sie dann formatieren, löschen oder umschreiben, ganz wie es Ihnen beliebt. Und danach speichern.

Das Häkchen ist wichtig.
Vergrößern Das Häkchen ist wichtig.
© 2014

Sie finden die erweitere Upload- und Konvertierungsfunktion links im Startmenü von Google Docs unter dem Button „Hochladen“. Klicken Sie darauf und setzen Sie auf der folgenden Seite das Häkchen in der Checkbox „Text aus PDF- oder Bilddateien in Google Text & Tabellen-Dokumente konvertieren“. Dann klicken Sie auf „Hochzuladende Dateien auswählen“ und wählen die Bild- oder PDF-Dateien aus. Anschließend starten Sie den Upload.

Anschließend öffnen Sie die konvertierte Datei wie gehabt in Google Docs/Texte. Nun wird es spannend: Denn die OCR-Funktion ist noch nicht ganz ausgereift und kann nicht den kompletten Text von PDFs oder Bildern in das Textformat konvertieren.

Kurztest: Bei einem PDF mit Steuertipps wurde zirka die Hälfte des im PDF enthaltenen Textes in einen solchen umgewandelt und kann dementsprechend wie Text bearbeitet werden. Bei einer Bilddatei wurde im Test gar kein Text umgewandelt. Das überrascht allerdings nicht, weil Google ganz klare Vorgaben dafür macht, wann eine Konvertierung funktioniert. So muss der Text auf JPGs, GIFs und PNGs horizontal von links nach rechts verlaufen, schräg gestellten Text kann Googles OCR nicht erkennen. Der Text muss zudem aus lateinischen Buchstaben bestehen. Die Bilder sollen zudem möglichst hochauflösend sein, die Textbestandteile sollten mindestens 10 Pixel hoch sein.

Konvertierte Bilddateien und PDFs dürfen maximal 2 MB groß sein. Bei PDFs werden nur die ersten zehn Seiten konvertiert. Das Konvertieren und anschließende Öffnen der Dateien dauert einige Sekunden.

Fazit: Auch wenn die OCR-Funktion noch gewissen Einschränkungen unterliegt, ist das ein spannender Schritt in die richtige Richtung, der bei der täglichen Arbeit mit Google Docs/Texte gerade im Unternehmenseinsatz eine deutliche Arbeitserleichterung verspricht.

OCR-Software gehört normalerweise zum typischen Softwareumfang eines Scanners.

0 Kommentare zu diesem Artikel
2937