08.11.2011, 10:35

Dirk-Bongardt

Sicherheit

Textpassagen in PDF-Dokumenten zuverlässig schwärzen

Textpassagen in PDF-Dokumenten zuverlässig schwärzen ©iStockphoto.com/kyoshino

Das PDF-Dateiformat hat sich, wenn es um das Speichern und Weitergeben von Dokumenten geht, zu einem Quasi-Standard entwickelt. Problematisch wird das, wenn diese Dokumente vertrauliche Informationen enthalten, die vor der Weitergabe unkenntlich gemacht werden sollen. Dabei passieren leicht Fehler, die die Vertraulichkeit ad absurdum führen.
Werden Schriftstücke mit heiklem Inhalt, zum Beispiel Gerichtsurteile, Kontoauszüge oder medizinische Gutachten, als PDF-Dokumente veröffentlicht oder an Dritte weitergegeben, die nicht alle Details des Inhalts erfahren sollen, werden die als vertraulich erachteten Passagen in der Regel geschwärzt. 
Doch wer die falsche Vorgehensweise wählt, stachelt damit nur die Neugier der Empfänger an, ohne die Informationen wirksam zu verbergen. Das ist schon Institutionen passiert, bei denen man entsprechende Sachkenntnis eigentlich hätte erwarten dürfen: Im Jahr 2005 veröffentlichte das Pentagon einen Bericht über die Erschießung des Geheimdienstagenten Nicola Calipari und der Verwundung der italienischen Journalistin Giuliana Sgrena im Irak als PDF-Dokument. Im ursprünglich in Microsoft Word verfassten Bericht hatten die Pentagon-Mitarbeiter vertrauliche Informationen vor dem PDF-Export als „schwarze Schrift auf schwarzen Hintergrund“ formatiert. Über ein einfaches Kopieren und Einfügen in eine beliebige Textverarbeitung ließen sich diese Informationen – unter anderem Ränge und Namen aller beteiligten US-Soldaten – wieder  sichtbar machen. Ähnliches, allerdings mit weniger lebensgefährlichen Folgen, passierte Facebook vier Jahre später: In einem Gerichtsdokument waren brisante Zahlen des Unternehmens vor der Weitergabe an Journalisten geschwärzt worden – ebenso stümperhaft wie seinerzeit von Pentagon-Mitarbeitern, und prompt erfuhr die Öffentlichkeit von einer überraschend niedrigen Einschätzung des Unternehmenswertes. Mit entsprechenden Folgen an den Finanzmärkten.
Diese beiden, wohl bekanntesten, PDF-Pannen hatten eine gemeinsame Ursache: Die Dokumente wurden ursprünglich mit einer Textverarbeitung verfasst, vertrauliche Informationen durch eine spezielle Formatierung darin unsichtbar gemacht, und die Dokumente dann ins PDF-Format exportiert.
Inhalte ändern, nicht die Formatierung
Das Beispiel zeigt: Es genügt nicht, die Formatierung zu ändern. Auch beim Export in das PDF-Format werden Inhalte und Formate separat gespeichert, und es bedarf keines Hacker-Wissens, um per Formatierung geschwärzte Inhalte wieder sichtbar zu machen. Genau so nutzlos ist übrigens die Vorgehensweise, schwarze Balken als grafische Objekte über die vertraulichen Passagen zu legen. Die mögen dann nicht mehr ganz so einfach zu extrahieren sein, aber spätestens, wenn das Dokument mit Adobe Acrobat oder einem anderen Programm zur PDF-Bearbeitung geöffnet wird, ist der so „verborgene“ Text wieder lesbar.
Um vertrauliche Informationen in PDF-Dokumenten dauerhaft unsichtbar zu machen, hilft nur eines: Die Informationen müssen daraus entfernt werden. Dazu gibt es grundsätzlich zwei Ansätze: Soll das PDF-Dokument durchsuchbar bleiben, und der nicht-vertrauliche Text per Kopieren und Einfügen in andere Dokumente übernommen werden können, müssen Sie im Text des Dokumentes die vertraulichen Passagen löschen oder, wenn weiter zu ersehen sein soll, wo „geschwärzt“ wurde, ersetzen, zum Beispiel durch ein großes X.
Spielt es hingegen keine Rolle, ob das PDF-Dokument durchsuchbar bleibt, und der nicht-vertrauliche Text extrahiert werden kann, können Sie das PDF-Dokument stattdessen mit einem Grafikprogramm öffnen, die vertraulichen Passagen mit dicken schwarzen Linien übermalen und das Dokument als PDF mit eingebetteter Grafik überschreiben.
Wer ein solches Dokument mit einer Textverarbeitung selbst erstellt, hat es natürlich am einfachsten: Er speichert eine zweite Fassung des Originaldokuments, in dem die vertraulichen Informationen nicht mehr vorhanden sind, und exportiert dieses in eine PDF-Datei, die er dann bedenkenlos weitergeben kann. Aber auch, wenn Sie Informationen in bereits fertigen PDF-Dokumenten unkenntlich machen müssen, gibt es einfache Wege.
Lesen Sie auf der nächsten Seite:
Vorherige Seite
Seite 1 von 2
Kommentare zu diesem Artikel (2)
PC-WELT Hacks
PC-WELT Hacks Logo
Technik zum Selbermachen

3D-Drucker selbst bauen, nützliche Life-Hacks für den PC-Alltag und exotische Projekte rund um den Raspberry Pi. mehr

Angebote für PC-WELT-Leser
PC-WELT Onlinevideothek

PC-WELT Online-Videothek
Keine Abogebühren oder unnötige Vertragsbindungen. Filme und Games bequem von zu Hause aus leihen.

Tarifrechner
Der PC-WELT Preisvergleich für DSL, Strom und Gas. Hier können Sie Tarife vergleichen und bequem viel Geld sparen.

PC-WELT Sparberater
Das Addon unterstützt Sie beim Geld sparen, indem es die besten Angebote automatisch während des Surfens sucht.

Telekom Browser 7.0

Telekom Browser 7.0
Jetzt die aktuelle Version 7 mit neuem Design und optimierter Benutzerführung herunterladen!

- Anzeige -
Marktplatz
Amazon

Amazon Preishits
jetzt die Schnäpchen bei den Elektronikartikel ansehen! > mehr

UseNext

10 Jahre UseNeXT
Jetzt zur Geburtstagsaktion anmelden und 100 GB abstauben! > mehr

1164311
Content Management by InterRed