2110132

Defekte Office-Dokumente in Linux-Distributionen retten

01.11.2015 | 16:19 Uhr |

Ein havariertes System ist lästig, aber im Fall der Fälle vergleichsweise schnell wieder neu aufgebaut. Fast schwerer wiegt der Verlust von Dokumentdateien, für die keine Sicherungskopie vorliegt.

Es gibt kaum einen PC-Arbeitsplatz, an dem sich dieses Drama nicht schon einmal abgespielt hat: Das gerade noch bearbeitete Dokument landet in korrumpierter Form auf der Netzwerkfreigabe oder in der Cloud und lässt sich anschließend nicht mehr öffnen. Gerade bei der Arbeit im Netzwerk mit einer instabilen WLAN-Verbindung tritt dieser Fall häufiger ein. Das Resultat ist eine beschädigte Dokumentdatei, die sich schlimmstenfalls nicht mehr öffnen lässt. Selbst wenn noch eine ältere Version als Sicherungskopie vorliegt, so ist es immer noch schade um die verlorene Arbeit. Aber auch ohne Backup ist noch nicht alles verloren. Die folgenden Tipps zeigen, was Sie zur Wiederbelebung von Office-Dokumenten in den Formaten von Libre Office und Microsoft Office auf einem Linux-System tun können.

Vorbereitung: Immer eine Kopie anlegen

Es gibt neben offensichtlichen Beschädigungen an der Struktur eines Dokuments, über die sich das jeweilige Office-Programm beim Öffnen beschwert, noch einen anderen Typ von Defekt: Subtilere Probleme, die beim Speichern von Formaten entstehen, die dem verwendeten Office-Programm fremd sind, sind oft nicht gleich ersichtlich. Die Datei lässt sich ohne Fehlermeldung öffnen, aber es fehlen ganze Teile am Ende des Dokuments oder auch Bilder, Formeln und Tabellen. In jedem Fall dürfen Sie die beschädigte Originaldatei nach dem Öffnen nicht mit einer neuen Version überschreiben. Legen Sie zuvor immer eine Sicherungskopie der defekten Datei an, und starten Sie dann die Reparaturversuche nur mit dieser Kopie. Denn sonst besteht die Gefahr, dass bei einer gescheiterten Wiederbelebung noch mehr Inhalte permanent verloren gehen.

Die Reparaturfunktion von Libre Office erkennt zwar, wenn eine Datei nicht Ordnung ist, steigt aber schon bei kleinen Fehlern im Datei-Header aus.
Vergrößern Die Reparaturfunktion von Libre Office erkennt zwar, wenn eine Datei nicht Ordnung ist, steigt aber schon bei kleinen Fehlern im Datei-Header aus.

Auf andere Programme ausweichen

Wenn der Absturz des Systems oder ein Programmfehler von Libre Office die Arbeit jäh unterbricht und ein ungesichertes Dokument zurücklässt, so arbeitet die Wiederherstellung beim nächsten Start von Libre Office angenehm zuverlässig. Ungesicherte Arbeiten sichert das Büropaket im temporären Verzeichnis „/tmp“ und begrüßt Sie beim nächsten Start mit dem Dialog der „Dokumentenwiederherstellung“, die den letzten automatisch gespeicherten Stand der ungesicherten Dateien restauriert. Anders sieht es aus, wenn Libre Office ein bereits beschädigtes Dokument öffnen soll. Einen Versuch ist es zwar immer wert, jedoch ist die interne Reparaturfunktion von Libre Office bei strukturellen Fehlern in Datei-Headern schnell überfordert und steigt mit einem Ein-Ausgabe-Fehler aus. Es gibt aber Alternativen, die beim Öffnen einer Datei toleranter sind und oft noch Erfolg haben, wenn Libre Office das Handtuch wirft.

Abiword: Die Textverarbeitung kann nicht nur mit den eigenen Dateiformaten umgehen, sondern auch mit Dokumenten vom Typ RTF, ODT, DOC und DOCX. Der Importfilter für diese Typen kommt auch mit beschädigten Dateien erstaunlich gut zurecht. Abiword ist den Paketquellen aller verbreiteten Linux-Distribution vorhanden und unter Debian/Ubuntu mit

sudo apt-get install abiword

schnell installiert.

Gnumeric: Die alternative Tabellenkalkulation öffnet die Formate ODS, XLS und XLS und lässt sich auch nicht beeindrucken, wenn Bytes am Ende der Datei fehlen. Bei beschädigtem Header liefert Gnumeric keine besseren Ergebnisse als Libre Office Calc. Das Paket Gnumeric ist über die Paketmanager aller großen Distributionen verfügbar.

WPS Office: Das Büropaket der chinesischen Software-Firma Kingsoft gibt es in einer kostenlosen Version für Linux. WPS Office, früher als Kingsoft Office bekannt, versteht sich gut auf die Microsoft-Formate DOC, DOCX, XLS, XLSX, PPT und PPTX. Zur Installation stehen unter http://wps-community.org/download.html DEB-und RPM-Pakete bereit, die das Büropaket unter Debian , Ubuntu (DEB) sowie Open Suse und Fedora (RPM) installieren.

Generell bietet Abiword bessere Chancen als Libre Office, beschädigte Dateien zu öffnen und wenigstens das Wichtigste zu retten.
Vergrößern Generell bietet Abiword bessere Chancen als Libre Office, beschädigte Dateien zu öffnen und wenigstens das Wichtigste zu retten.

Manuelle Rettung: Als ZIP-Archiv entpacken

Das Open-Document-Format von Libre Office (ODT, ODS, ODP) und Open Office sowie das Format OOXML von Microsoft (DOCX, XSLX, PPTX) bestehen aus einem ZIP-Archiv. Das Archiv enthält mehrere einzelne Dateien für Struktur, Objekte wie Bilder und speichert den Textinhalt in einer XML-Datei ab. Schwer angeschlagene Dokumente können Sie zunächst mit dem Kommandozeilenprogramm zip wie eine beschädigte ZIP-Datei behandeln und mittels der eingebauten Reparaturfunktion in eine neue Datei mit restauriertem Header schreiben. Um eine Datei von Libre Office Writer mit dem Namen „dokument.ods“ so zu behandeln, geben Sie in einem Terminal den Befehl

zip -F dokument.ods --out repariert.ods

ein. Versuchen Sie dann abermals, die so erzeugte Datei „repariert.ods“ mit Libre Office zu öffnen.

Falls das immer noch nicht gelingt, dann gibt es noch einen Reparaturparameter mit einer sehr losen Interpretation des ZIP-Formats:

zip -FF dokument.ods --out repariert.ods

Sollte sich der Datei-Header mit diesem zweiten Befehl reparieren lassen, dann können Sie anschließend wenigstens einige Dateien extrahieren. Hilfreich ist das bei Dokumenten von Libre Office Writer (ODT) und Microsoft Word (DOCX), denn Sie können so zumindest noch Teile des Texts manuell retten. Entpacken Sie dazu die zuvor restaurierte Datei mit dem folgenden Kommando

unzip repariert.ods

Den Textinhalt finden Sie dann bei DOCX-Dateien in der Datei „Document.xml“ im Verzeichnis „Word“. Bei ODT-Dateien liegt der Text als „content.xml“ vor. Es handelt sich in beiden Fällen um Dateien in einer XML-Struktur mit zahlreichen Tags. Für die Ansicht des eigentlichen Inhalts können Sie die XML-Tags mit Hilfe eines Browsers ausblenden: Benennen Sie die Dateiendung von „.xml“ nach „.html“ um, und öffnen Sie die Datei mit Firefox oder Chrome/Chromium . Der Browser präsentiert nun den puren Textinhalt ohne Struktur und Formatierungen, den Sie jetzt in ein neues Dokument kopieren und einfügen können.

Korrekte Sonderzeichen erhalten Sie, wenn Sie die Zeichencodierung zu „Unicode“ umstellen, was in Firefox über das Menü „Ansicht -> Zeichenkodierung -> Unicode“ gelingt und in Chrome/Chromium über das Menüsymbol mit „Weitere Tools -> Codierung -> Unicode (UTF-8)“.

0 Kommentare zu diesem Artikel
2110132