1807447

Störende Zeichen aus kopiertem Text entfernen

31.10.2013 | 15:33 Uhr |

Es ist nicht immer einfach, Text ohne böse Überraschungen zu kopieren. Wer mit unerwarteten Zeichen und Formatfehlern zu kämpfen hat, kann nützliche Tools zu Rate ziehen.

Beim Adobe Reader beispielsweise landen ungewollt Textformatierungen und bei Spaltensatz auch überflüssige Zeilenumbrüche im Dokument. Diese manuell zu entfernen ist jedoch ziemlich umständlich. Was genau in Ihrem Dokument landet, wenn Sie Text aus PDFs kopieren und einfügen, hängt auch vom PDF-Anzeigeprogramm und dem Inhalt der PDF-Datei ab.

Der Adobe Reader entfernt die Trennstriche der Silbentrennung nur teilweise und stellt Überschriften manchmal nicht korrekt dar. Der Sumatra PDF-Reader zeigt dagegen bei vielen Texten weniger Fehler beim Textexport. Perfekt arbeiten beide nicht, es hilft nur Ausprobieren. Das Ergebnis hängt auch davon ab, ob die Trennstriche im Dokument, aus dem das PDF erzeugt wurde, richtig codiert waren.

Suchen und Ersetzen: Wenn Sie nur gelegentlich eingefügten Text aus PDFs bereinigen müssen, genügt die „Suchen und Ersetzen“-Funktion der Textverarbeitung. Markieren Sie den Text im PDF und drücken Sie die Tastenkombination Strg-C. In Word drücken Sie dann Strg-Alt-V, in Open Office / Libre Office Strg-Umschalt-V. Wählen Sie „Unformatierten Unicode-Text“ oder „Unformatierter Text“ – je nachdem, was angeboten wird – und klicken Sie auf „OK“.

Gehen Sie dann in Word auf „Start ➞ Ersetzen“. Geben Sie hinter „Suchen nach“ ^p ein oder klicken Sie auf „Sonderformat ➞ Absatzmarke“. Hinter „Ersetzen durch“ geben Sie ein Leerzeichen ein und klicken dann auf „Alle ersetzen“. In Open Office/Libre Office gehen Sie im Menü auf „Bearbeiten ➞ Suchen & Ersetzen“, klicken auf „Mehr Optionen“ und setzen ein Häkchen vor „Regulärer Ausdruck“. Tippen Sie hinter „Suchen nach“ das Zeichen $ ein. Hinter „Ersetzen durch“ gehört ein Leerzeichen. Klicken Sie auf „Ersetzen alle“.

Entstörungsdienst: Die nervigsten Windows-Macken im Griff

Makro verwenden: Komfortabler geht’s mit einem Makro. Dieses kann auch einige Spezialfälle berücksichtigen. Die Wahrscheinlichkeit etwa, dass nach einem Punkt am Zeilenende tatsächlich ein neuer Absatz beginnt, ist relativ hoch. Dieser sollte dann erhalten bleiben. Per Makro lassen sich auch leere Absätze entfernen, die Sie in Ihrem Dokument nicht haben wollen. In unserem Downloadbereich finden Sie jeweils ein Makro für Word 2007/2010 und Open Office/Libre Office zusammen unter dem Namen Pastepdftext .

Mit den Makros können Sie per Klick oder über eine Tastenkombination den Inhalt der Zwischenablage einfügen und dabei gleich die erforderlichen Ersetzungen im Text vornehmen. Die Kommentare in dem Makro beschreiben die Funktionen, so dass Sie – falls erforderlich – individuelle Anpassungen vornehmen können. Wenn Sie nicht wissen, wie sich Makros in die Textverarbeitung einbauen lassen, lesen Sie die Kurzanleitung Readme.txt in den jeweiligen Ordnern.

0 Kommentare zu diesem Artikel
1807447