2422953

Libre Office und Docbook: So nutzen Sie die Exportmöglichkeiten des Writer optimal

08.05.2019 | 15:03 Uhr | Thorsten Eggeling

Libre Office kann Dateien in verbreiteten Formaten wie DOC, DOCX oder PDF speichern. Eine alternative Exportmethode bietet sich bei umfangreichen Dokumenten an oder wenn eine einheitliche Formatierung das Ziel ist.

Die Exportfähigkeiten von Libre Office haben sich stetig verbessert. Der PDF-Export beispielsweise bietet für die meisten Anwender genügend Funktionen. Verbesserungsbedürftig bleibt jedoch der HTML-Export, der teilweise unnötig komplizierten HTML-Code produziert und nach wie vor keine Möglichkeit bietet, externe CSS-Dateien für die Formatierung einzubinden. Es gibt jedoch eine alternative Methode für den Dateiexport, die vor allem auf die einheitliche Formatierung der Dokumente spezialisiert ist. Wir haben die dafür nötigen Scripts für den schnellen Einsatz vorkonfiguriert . Für die individuelle Konfiguration ist jedoch etwas Einarbeitungszeit erforderlich. Deshalb eignet sich das Verfahren vor allem für Nutzer, die regelmäßig Dokumentationen, Anleitungen oder Bücher verfassen.

Docbook als Austauschformat

Libre Office nutzt intern XML als strukturierten Datenspeicher, was die Konstruktion von Exportfiltern erleichtert. Bei den eingebauten Filtern sind Sie jedoch auf das angewiesen, was die Entwickler mitliefern. Es ist flexibler, ein Libre-Office-Dokument zuerst in gebräuchliches Austauschformat zu überführen und danach in das gewünschte Zielformat. Dafür bietet sich Docbook an, ein Dokumentformat, das bei vielen Büchern, Artikeln und Dokumentationen im Linux-Umfeld zum Einsatz kommt. Mit Docbook lässt sich medienneutral und plattformunabhängig arbeiten. Docbook-XML-Dateien enthalten – ähnlich HTML – neben dem Dokumentinhalt nur Tags wie „<chapter>“ oder „<para>“, die beispielsweise den Beginn von Kapiteln und Absätzen markieren. Die Formatierungen kommen erst bei der Umwandlung etwa in HTML, PDF oder Epub hinzu. Docbook leistet jedoch noch mehr. Es lassen sich beispielsweise auch Kapitel, Bilder und Tabellen automatisch nummerieren sowie Verzeichnisse erstellen.

PDF-Export: Umgewandelte PDF-Dateien enthalten Lesezeichen für die bequeme Navigation.
Vergrößern PDF-Export: Umgewandelte PDF-Dateien enthalten Lesezeichen für die bequeme Navigation.

Docbook-Tools verwenden: Für die Konvertierung von Libre-Office-Dokumenten benötigen Sie einige Dateien, die Sie über www.pcwelt.de/5vVC9S herunterladen und in Ihr Home-Verzeichnis entpacken, etwa in den Ordner „~/lwText“. Im Terminal installieren Sie dann diese Pakete (Debian & Co.):

sudo apt install python xsltproc default-jre fop ant xterm

Probieren Sie die Funktionen des Konverters mit einer der Beispieldateien aus.

cd~/lwText ./lwTextExporter.py -c html ~/lwText/Beispiele/beispiel_de.odt

Das Ergebnis finden Sie im Ordner „Ausgabe/beispiel_de“. Geben Sie die ODT-Datei immer mit vollständigem Pfad an, die Abkürzung „~“ für das Home-Verzeichnis ist jedoch erlaubt. Hinter „-c“ steht das Ausgabeformat.

Dabei sind folgende Optionen möglich:

html: Es entsteht eine einzelne HTML-Datei mit Inhaltsverzeichnis.

html_nav: Das Script erzeugt eine HTML-Datei pro Kapitel. Die erste Datei heißt „index.html“ und enthält das Inhaltsverzeichnis. Es gibt außerdem Navigationslinks wie „Weiter“, „Zurück“ und „Zum Anfang“.

pdf: Das Ergebnis ist eine PDF-Datei mit Titelblatt und Lesezeichen für die Navigation.

epub: Die Epub-Datei enthält ein Inhaltsverzeichnis und das Umschlagsbild aus dem Ordner „Vorlagen/epub3/cover/cover.jpg“.

webhelp: Das Ergebnis ist ähnlich wie bei „html_nav“. Es entsteht eine HTML-Datei pro Kapitel, die erste Datei ist „index.html“. Die Navigation erfolgt alternativ über eine Sidebar, die das Inhaltsverzeichnis zeigt. Außerdem gibt es eine Suchfunktion mit Hervorhebung der Fundstelle. Die meisten Bestandteile der Webhilfe liegen als Vorlage im Ordner „Webhelp/template“.

Datei ohne Formatierung: Ein XML-Dokument enthält nur die logische Struktur und den Textinhalt.
Vergrößern Datei ohne Formatierung: Ein XML-Dokument enthält nur die logische Struktur und den Textinhalt.

Das Exportergebnis lässt sich über die Datei „config/profiles.cfg“ beeinflussen. Die Datei enthält Optionen für jedes Format, unter „[0]“ für „html“, unter „[1]“ für „html_nav“ und so weiter. Verwenden Sie beim Start auf der Kommandozeile die Option „-p [ID]“, um ein anderes Profil zu verwenden.

Hinter „html.stylesheet=“ steht, wo die CSS-Datei für die Formatierung von HTML-Dateien zu finden ist. Für PDF-Dateien legen Sie hinter „body.start.indent=“ den Seitenrand fest. Eine Übersicht mit der Bedeutung aller Optionen finden Sie, indem Sie die Datei „Docbook/doc/index.html“ im Webbrowser öffnen.

Tipp: Im Ordner „lwText/lib/Makros“ finden Sie eine Textdatei mit Makrocode für Libre Office. Die Datei enthält auch eine Anleitung, wie Sie den Makrocode einbauen und bequem starten. Es ist dann möglich, das aktuelle Dokument von Libre Office aus mit einem Mausklick zu konvertieren.

Lesetipp Libre Office 6.2 veröffentlicht – zwei neue Oberflächenvarianten vorgestellt

Vorlagen und Formatierungen

Die Datei „lwText/Beispiele/beispiel_de.odt“ enthält die wichtigsten Formatvorlagen für ein Docbook-Dokument. Ein Buch fängt immer mit zwei Zeilen für das Deckblatt an, denen die Formatvorlagen „Titel“ und „Untertitel“ zugewiesen sind. Danach folgen optionale Infos zu Autor und Urheber. Jeder Kapitelüberschrift ist die Absatzvorlage „Überschrift 1“ zugewiesen, danach folgen „Überschrift 2“ oder „Überschrift 3“ je nach Bedarf. Die Auszeichnungen „fett“ oder „kursiv“ verwenden Sie wie gewohnt, alternativ die Zeichenvorlagen „Betont“ und „Stark betont“.

Wenn Sie über „Einfügen –› Bild“ eine Abbildung in das Dokument einfügen, darf kein Häkchen bei „Verknüpfen“ gesetzt sein. Außerdem muss in den „Eigenschaften“ des Bildes auf der Registerkarte „Optionen“ Beschreibungstext hinter „Name:“ sowie „Alternativtext:“ eingetragen sein.

Formatierungen im konvertierten Dokument

Bei allen HTML-Dokumenten erfolgt die Formatierung über CSS-Dateien. In unserer Beispielkonfiguration verwenden wir die Datei „Ausgabe/common/dbk_html_3.css“, die Sie beliebig anpassen können. Für elektronische Bücher im Epub-Format sind „Ausgabe/common/epub.css.xml“ und „Docbook/epub3/docbook-epub.css.xml“ zuständig. Wer sich genauer mit den Möglichkeiten von CSS informieren will, findet ausführliche Anleitungen mit zahlreichen Beispielen unter https://wiki.selfhtml.org .

Anpassungen für die PDF-Ausgabe sind komplizierter. Formatanweisungen müssen hier direkt während der Umwandlung eingebaut werden. Es gibt aber in der Datei „config/profiles.cfg“ unter „[5]“ kommentierte Beispiele, wie sich etwa Schriftart oder Schriftgröße ändern lässt. Wer aufwendigere Formatierungen benötigt, kommt um eine Anpassung der XSL-Vorlagen nicht herum. Allerdings kann man auch im Internet nach Dateien suchen, die Open-Source-Projekte für ihre Dokumentation verwenden. Mit ein paar Anpassungen ist vielleicht das Gewünschte dabei. Probieren Sie diese Befehlszeile aus:

./lwTextExporter.py -c pdf -p 5 -x ~/lwText/xsl/custom_fo.xsl ~/lwText/Beispiele/beispiel_de.odt

„custom_fo.xsl“ und weitere Dateien unter „lwText/fo“ stammten von der Dokumentation zum Datenbankserver Firebird ( https://github.com/FirebirdSQL/firebird-documentation ). Die Konvertierung bietet ein Deckblatt mit eigenem Logo („lwText/Ausgabe/common/images/Mein_Logo.png“), ferner Überschriften mit farblicher Hinterlegung sowie eine andere Textfarbe für „Überschrift 1“ und „Überschrift 2“.

PC-WELT Marktplatz

2422953