Sicherheit

Textpassagen in PDF-Dokumenten zuverlässig schwärzen

Dienstag den 08.11.2011 um 10:35 Uhr

von Dirk-Bongardt

Textpassagen in PDF-Dokumenten zuverlässig schwärzen
Vergrößern Textpassagen in PDF-Dokumenten zuverlässig schwärzen
© iStockphoto.com/kyoshino
Das PDF-Dateiformat hat sich, wenn es um das Speichern und Weitergeben von Dokumenten geht, zu einem Quasi-Standard entwickelt. Problematisch wird das, wenn diese Dokumente vertrauliche Informationen enthalten, die vor der Weitergabe unkenntlich gemacht werden sollen. Dabei passieren leicht Fehler, die die Vertraulichkeit ad absurdum führen.
Werden Schriftstücke mit heiklem Inhalt, zum Beispiel Gerichtsurteile, Kontoauszüge oder medizinische Gutachten, als PDF-Dokumente veröffentlicht oder an Dritte weitergegeben, die nicht alle Details des Inhalts erfahren sollen, werden die als vertraulich erachteten Passagen in der Regel geschwärzt. 

Doch wer die falsche Vorgehensweise wählt, stachelt damit nur die Neugier der Empfänger an, ohne die Informationen wirksam zu verbergen. Das ist schon Institutionen passiert, bei denen man entsprechende Sachkenntnis eigentlich hätte erwarten dürfen: Im Jahr 2005 veröffentlichte das Pentagon einen Bericht über die Erschießung des Geheimdienstagenten Nicola Calipari und der Verwundung der italienischen Journalistin Giuliana Sgrena im Irak als PDF-Dokument. Im ursprünglich in Microsoft Word verfassten Bericht hatten die Pentagon-Mitarbeiter vertrauliche Informationen vor dem PDF-Export als „schwarze Schrift auf schwarzen Hintergrund“ formatiert. Über ein einfaches Kopieren und Einfügen in eine beliebige Textverarbeitung ließen sich diese Informationen – unter anderem Ränge und Namen aller beteiligten US-Soldaten – wieder  sichtbar machen. Ähnliches, allerdings mit weniger lebensgefährlichen Folgen, passierte Facebook vier Jahre später: In einem Gerichtsdokument waren brisante Zahlen des Unternehmens vor der Weitergabe an Journalisten geschwärzt worden – ebenso stümperhaft wie seinerzeit von Pentagon-Mitarbeitern, und prompt erfuhr die Öffentlichkeit von einer überraschend niedrigen Einschätzung des Unternehmenswertes. Mit entsprechenden Folgen an den Finanzmärkten.

Diese beiden, wohl bekanntesten, PDF-Pannen hatten eine gemeinsame Ursache: Die Dokumente wurden ursprünglich mit einer Textverarbeitung verfasst, vertrauliche Informationen durch eine spezielle Formatierung darin unsichtbar gemacht, und die Dokumente dann ins PDF-Format exportiert.

Inhalte ändern, nicht die Formatierung

Das Beispiel zeigt: Es genügt nicht, die Formatierung zu ändern. Auch beim Export in das PDF-Format werden Inhalte und Formate separat gespeichert, und es bedarf keines Hacker-Wissens, um per Formatierung geschwärzte Inhalte wieder sichtbar zu machen. Genau so nutzlos ist übrigens die Vorgehensweise, schwarze Balken als grafische Objekte über die vertraulichen Passagen zu legen. Die mögen dann nicht mehr ganz so einfach zu extrahieren sein, aber spätestens, wenn das Dokument mit Adobe Acrobat oder einem anderen Programm zur PDF-Bearbeitung geöffnet wird, ist der so „verborgene“ Text wieder lesbar.

Um vertrauliche Informationen in PDF-Dokumenten dauerhaft unsichtbar zu machen, hilft nur eines: Die Informationen müssen daraus entfernt werden. Dazu gibt es grundsätzlich zwei Ansätze: Soll das PDF-Dokument durchsuchbar bleiben, und der nicht-vertrauliche Text per Kopieren und Einfügen in andere Dokumente übernommen werden können, müssen Sie im Text des Dokumentes die vertraulichen Passagen löschen oder, wenn weiter zu ersehen sein soll, wo „geschwärzt“ wurde, ersetzen, zum Beispiel durch ein großes X.

Spielt es hingegen keine Rolle, ob das PDF-Dokument durchsuchbar bleibt, und der nicht-vertrauliche Text extrahiert werden kann, können Sie das PDF-Dokument stattdessen mit einem Grafikprogramm öffnen, die vertraulichen Passagen mit dicken schwarzen Linien übermalen und das Dokument als PDF mit eingebetteter Grafik überschreiben.

Wer ein solches Dokument mit einer Textverarbeitung selbst erstellt, hat es natürlich am einfachsten: Er speichert eine zweite Fassung des Originaldokuments, in dem die vertraulichen Informationen nicht mehr vorhanden sind, und exportiert dieses in eine PDF-Datei, die er dann bedenkenlos weitergeben kann. Aber auch, wenn Sie Informationen in bereits fertigen PDF-Dokumenten unkenntlich machen müssen, gibt es einfache Wege.

Dienstag den 08.11.2011 um 10:35 Uhr

von Dirk-Bongardt

Kommentieren Kommentare zu diesem Artikel (2)
  • theSystem 13:29 | 06.06.2012

    Passagen schwärzen und digitale Signatur erhalten??

    Der Nachteil der hier beschriebenen Vorgehensweisen liegt meines
    Erachtens leider nur darin, dass vorher geschützte Dokumente ihre
    Glaubwürdigkeit verlieren, da man mit diesen Manipulationen auch
    die eigentlichen Daten verfälschen kann. Daher frage ich mich wie
    z.B. Behörden solchen potentiell "verfälschten" Dokumenten trauen
    können. Vielleicht werden im Verdachtsfall einfach die Originale angefragt?
    Gibt es nicht hierfür einen Standard, der es erlaubt bei Erhaltung der
    digitalen Signatur eines z.B. Online-Kontoauszugs gewisse Passsagen
    durch XXX zu ersetzten, ohne dass dabei die Signatur verloren geht?
    Denn nur dies erscheint mir als eine gleichmächtige Alternative zu dem
    Verfahren des analogen Kopierens und Schwärzens von Dokumenten.
    Eine Möglichkeit wäre z.B von Seiten der Banken aus einen Schwärzungs-
    editor bereitzustellen. Gibt es sowas schon?

    Antwort schreiben
  • Didier K. 13:26 | 09.11.2011

    Schwarze Balken in PDF

    Endlich wieder mal ein Artikel, wie es sie früher in der PCWelt gab. Gute Infiormation, klare Beschreibung und woanders nicht sofort zu finden. Deshalb ist die PCWelt so groß geworden.
    Nicht, wie heute, wo viele Artikel entweder abgeschrieben oder wiederaufgewärmt werden.

    Antwort schreiben
1164311