06.12.2007, 08:30

Thomas Hümmler

OCR-Software

Finereader 9.0

Die Texterkennung Finereader 9.0 erkannte im Test nun auch das Layout einer Seite und übergab entsprechend zum Text auch die Seitengestaltung in guter Qualität ins Ausgabeformat.
OCR steht für Optical Character Recognition. OCR-Programme erkennen Text und wandeln diesen in ein Dokument, das der Benutzer bearbeiten kann. Der Ursprungstext kann ein Brief sein, ein Fax, eine Zeitungsseite oder ein PDF. Die Profiversion 9 von Abbyy Finereader scannt sogar mit einer Digitalkamera abfotografierte Dokumente.

Die Zeichenerkennung vom Foto einer Digitalknipse ist allerdings nicht neu, sondern nur verbessert worden. Zum ersten Mal hingegen ist die sogenannte ADR-Technik dabei, mit der die Seiten eines Textes im Ganzen analysiert und rekonstruiert werden. Dabei will die Software das Ergebnis im ursprünglichen Layout rekonstruieren – mit Überschriften, Spalten, Tabellen und Abbildungen und den ursprünglichen Formatierungen.
Das wollen wir genau testen: Mit einer Canon-EOS-Digitalkamera fotografieren wir eine Doppelseite aus der PC-Welt und füttern anschließend damit Finereader. Der hat zumindest kein Problem, das Dokument zu lesen – Finereader kennt 17 verschiedene Bildformate. Anschließend präsentiert das Programm sein Ergebnis. Das kann sich sehen lassen: Zum einen ist es erstaunlich, wie gut das Erkennen der Textelemente funktioniert.
Das gilt nicht nur für weit vom Text abgesetzte Dachzeilen und Vorspänne, sondern auch für Textkästen, die mitten im Text oder über ein Bild laufen. Eine auf der Seite vorhandene Tabelle wird ebenfalls richtig umgesetzt. Auch mit unterschiedlichen Schriften hat das Tool keine Schwierigkeiten. Und obwohl die Zeitschrift nicht exakt eben auf der Unterlage lag, werden sogar die Buchstaben nahe am Bund korrekt erkannt.
Dennoch gibt es ein paar Kritikpunkte: Nicht alle Buchstaben werden richtig interpretiert. Der durch Kästen aufgelockerte Lauftext wird zwar in Spalten angeordnet, aber nicht komplett zusammenhängend. Ein Nachbearbeiten des Dokuments ist also unbedingt erforderlich.
Fazit: Erstaunlich, was OCR-Software inzwischen kann. Auch, wenn es nicht ohne nachträgliche Bearbeitung geht, werden verschiedene Elemente des Textes doch relativ gut erkannt und getrennt.
Alternative: Nuance (www.nuance.de), ehemals Scansoft, bietet das vergleichbare OCR-Produkt Omnipage in der Basisversion für 120 Euro an.
BEWERTUNG

Leistung (50%): Note 2,5
Bedienung (35%): Note 2,0
Dokumentation (5%): Note 3,0
Installation/De-Installation (5%): Note 2,0
Systemanforderungen (5%): Note 3,0
GESAMTNOTE: 2,4
Anbieter: Abbyy
Weblink: www.abbyy.de
Preis: 150 Euro
Betriebssysteme: Windows 2000, XP, 2003, Vista
Plattenplatz: ca. 280 MB
Diskutieren Sie mit anderen Lesern über dieses Thema:
Windows 8: Alle Informationen
Windows 8
Alle Details

Alle Informationen und Updates zum neuen Betriebssystem Windows 8 von Microsoft. mehr

- Anzeige -
PC-WELT Specials
Angebote für PC-WELT-Leser
PC-WELT Onlinevideothek

PC-WELT Online-Videothek
Keine Abogebühren oder unnötige Vertragsbindungen. Filme und Games bequem von zu Hause aus leihen.

Tarifrechner
Der PC-WELT Preisvergleich für DSL, Strom und Gas. Hier können Sie Tarife vergleichen und bequem viel Geld sparen.

PC-WELT Sparberater
Das Addon unterstützt Sie beim Geld sparen, indem es die besten Angebote automatisch während des Surfens sucht.

- Anzeige -
Marktplatz

Amazon Preishits
jetzt die Schnäpchen bei den Elektronikartikel ansehen! > mehr

26406
Content Management by InterRed