2066878

Die besten Such-Tools für Linux-Systeme

24.04.2015 | 12:03 Uhr |

„Das habe ich doch irgendwo?“ Daten haben ist gut, Daten bei Bedarf schnell zu finden besser. Was Google, Bing oder Yahoo im großen Web vormachen, müssen Sie auf vergleichsweise kleinen Festplatten erst mal nachmachen.

Mit Recoll gibt es einen Allzweck-Allesfinder unter Linux, der aber wahrscheinlich nicht alle Komfortwünsche erfüllt. Je nachdem, welche Dateitypen Sie vorrangig nutzen und finden wollen, sind ergänzend noch weitere Werkzeuge zu empfehlen. Die folgenden Tipps berücksichtigen mit Text, Bild und Musik die wichtigsten digitalen Medien.

Recoll findet Texte, Bilder und Musik

Das grafische Recoll ist in allen gängigen Distributionen über die Paketverwaltung verfügbar. In Ubuntu bietet das Software-Center bei Recoll auch gleich unter „Weitere Informationen“ die optionalen Erweiterungen, die Sie am besten allesamt mitinstallieren. So findet Recoll etwa auch Exif-Tags in Bilddateien, wenn die Erweiterung libimage-exiftool-perl installiert ist. Über „Voreinstellungen -> Indizierungskonfiguration -> Globale Parameter“ legen Sie unter „Start-Verzeichnisse“ fest, welche Ordner in den Suchindex aufgenommen werden sollen. Mit der „+“-Schaltfläche fügen Sie Datenquellen hinzu, etwa externe USB-Laufwerke, die unter „/media/[user]“ eingehängt sind. Netzfreigaben sind ebenfalls möglich, sofern diese vorher in das Dateisystem gemountet wurden – etwa wie nachfolgend unter „/mnt/share1“:

sudo mount –t cifs –o username=sepp,password=sEpP//192.168.1.200/volume_1 /mnt/share1

Die zu indizierenden Ordner können Sie im genannten Recoll-Dialog jederzeit ändern und danach den Index mit „Datei -> Update Index“ aktualisieren oder mit „Rebuild Index“ auch neu erstellen.

Allzweckwaffe: Recoll findet Text, Bild und Musik inklusive Metadaten, und die Definition der Quellverzeichnisse ist komfortabel. Die Suchsyntax braucht etwas Eingewöhnung.
Vergrößern Allzweckwaffe: Recoll findet Text, Bild und Musik inklusive Metadaten, und die Definition der Quellverzeichnisse ist komfortabel. Die Suchsyntax braucht etwas Eingewöhnung.

Recoll findet nach der Indizierung Texte aus PDF, Office-Formaten, Text- und HTML-Dateien, Thunderbird-Mail, ferner Exif-Tags von Bildern und ID3-Metadaten von Musikformaten. Dass es auch die Dateinamen berücksichtigt, versteht sich von selbst. Die Suchsyntax ist nicht ganz intuitiv, zumal eine falsch eingestellte Syntaxoption irritierende Ergebnisse produzieren kann („Irgendein Ausdruck“ ist OR-Verknüpfung, „Alle Ausdrücke“ ist UND-Verknüpfung, „Suchsprache“ ist der Standard).

Die meisten Suchfehler vermeiden Sie dadurch, dass Sie Stellvertreterzeichen verwenden wie „*kanzler*“, was dann auch Flexionsformen und zusammengesetzte Wörter berücksichtigt. Eine Wortfolge wie „Angela Merkel“ setzen Sie am besten in Anführungszeichen, um sie als zusammengehörigen Suchbegriff zu definieren.

Beachten Sie, dass Recoll zahlreiche Schlüsselwörter für Metadaten unterstützt, abgesetzt durch einen Doppelpunkt: Die Suche nach „genre:classical“ würde also Audiodateien mit dem passenden Genre-Tag ermitteln (Näheres zur Abfragesyntax siehe hier ).

Volltextsuche: Dateien in Linux durchforsten

Alternativen bei der Suche von Musikdateien

Die standardisierten ID3-Tags für Musikdateien vom Typ MP3, OGG, APE, FLAC, WMA, MP4 werden wie Exif-Daten bei Fotos direkt in der Datei abgelegt und gelten daher plattformübergreifend. Nicht nur Recoll, sondern jeder bessere Linux- oder Windows-Audioplayer kann mit diesen Audio-Tags umgehen und somit nach Interpret, Album, Genre und dergleichen suchen. Problem ist nur, dass die Player mit Mediensammlungen größeren Umfangs meist technisch überfordert sind. Das Mediencenter XBMC/Kodi ist hier eine Ausnahme und leistet sowohl beim Indizieren des Bestands wie bei der Suche nach Audiodateien flotte Arbeit. XBMC bietet bei dieser Aufgabe naturgemäß mehr Komfort als ein Recoll, weil es die Treffer selbst abspielt oder in die Wiedergabeliste befördert.

Voraussetzung für eine erfolgreiche Suche und Organisation nach ID3-Metadaten ist die Existenz und annähernde Vollständigkeit der Tags. Bei großem Sammlungen aus diversen Quellen ist das keineswegs die Regel: Viele Infos fehlen, ein und dasselbe Genre erscheint in etlichen Variationen, als Albuminterpret erscheint die Track-Nummer und umgekehrt. Hier hilft nur ein externer Tag-Editor, der für solche Aufgaben spezialisiert ist. Erste Wahl ist hier das in den Repositories gängiger Distribution verfügbare Puddletag, das mit sudo apt-get install puddletag schnell installiert ist. Abgesehen vom englischsprachigen Menü entspricht es dem unter Windows beliebten MP3Tag.

Mit „File -> Open Folder“ wechseln Sie in den gewünschten Ordner. Mit der standardmäßig aktiven Option „Subfolders“ (links unten) werden alle enthaltenen Musikdateien in einer datenbankmäßigen Übersicht angezeigt. Im Prinzip lässt sich jedes Tag-Feld jeder Musikdatei manuell editieren (nach F2) – aber das ist nicht praktikabel. Effizient ist es hingegen, in einem Verzeichnis „Mozart“ alle Datensätze zu markieren und dann links oben im Drop-down-Feld „Genre“ den Eintrag „Classical“ zu wählen. Achten Sie darauf, dass alle anderen Felder „<keep>“ anzeigen – also das bisherige Tag behalten. Tatsächlich gespeichert wird erst nach „File -> Save“. Puddletag beherrscht auch raffinierte Methoden wie „Convert -> File>Tag“ (und umgekehrt), wobei es Dateinamen als Quelle für die Tags verwendet (oder umgekehrt). Dies setzt bei der Quelle absolute Systematik voraus und kann, angewendet auf viele Dateien, chaotisch enden.

Alternativen bei der Suche von Fotodateien

Der Exif-Block (Exchangeable Image File Format) ist der Standard für Metainfos, die Digitalkameras über die aufgenommenen Bilder speichern. Jede Kamera schreibt unter anderem das Aufnahmedatum, Kameras mit GPS auch Ortsinfos in die Datei (Geotags). Zur besseren Organisation der Bilder und Fotos lassen sich in den Exif-Block auch eigene Tags eintragen (je nach Software auch als „Schlagwörter“ oder „Markierungen“ bezeichnet). Systematische Personen-, Orte-, Aktionen-Tags sind unschlagbar, um Bilder schnell zu filtern. Da sie direkt in die Bilddatei geschrieben werden, funktionieren sie plattformübergreifend unter Linux, Windows und Mac-OS.

Bildverwaltung Shotwell: Der Viewer liest die Exif-Schlagwörter beim Importieren der Quelle ein und zeigt sie dann in der Navigationsspalte unter „Tags“.
Vergrößern Bildverwaltung Shotwell: Der Viewer liest die Exif-Schlagwörter beim Importieren der Quelle ein und zeigt sie dann in der Navigationsspalte unter „Tags“.

Für die Bildersuche gibt es Alternativen zu Recoll, die spezialisierter und komfortabler sind. Das Mediencenter XBMC/Kodi gehört definitiv nicht dazu: Eventuell bringt es als „Kodi“ demnächst eine brauchbare Bilddatenbank mit. Aktuell ist XBMC keine taugliche Bildverwaltung, kann mit Exif-Metadaten nicht umgehen und neigt zu Abstürzen bei der Anzeige von Bildersammlungen. Hier sollten Sie auf Bildverwaltungen ausweichen:

Die oft standardmäßig installierten Bildverwaltungen gthumb und Shotwell beherrschen beide Bilder-Tags: In Shotwell gehen Sie auf „Datei -> Aus Ordner importieren“, wonach Sie die Option „Nur Verweise importieren“ wählen (andernfalls werden alle Dateien physisch kopiert). Die Tags werden automatisch eingelesen und in der Navigationsspalte links angezeigt. Ein Klick auf einen Tag filtert sofort die passenden Dateien. Tag-Änderungen sind nach Rechtsklick und „Tags ändern“ für markierte Bilder jederzeit möglich.

gthumb kopiert mit der Option „Datei -> Importieren von -> Ordner“ grundsätzlich physisch nach „~/Bilder“, was bei großen externen Bildersammlungen kaum erwünscht ist. Wählen Sie daher besser über die Navigationsspalte den Ordner mit den Bilddateien. Danach erscheint rechts oben über dem Anzeigefenster die Schaltfläche „Ordnen“. Wenn Sie hier „Schlagwort eingebettet“ wählen, werden alle Tags eingelesen. Diese zeigen sich danach in der Navigationsleiste unter „Kataloge -> Schlagwörter“. Änderungen oder Neudefinitionen von Tags erfolgen für die markierten Bilder nach Rechtsklick und der Option „Schlagworte“.

Dieser Artikel stammt aus der LinuxWelt 2/2015

Die Themenschwerpunkte der neuen Linux-Welt 02/2015 sind Medien-Streaming und Perfekter Speicher. Die neue Ausgabe finden Sie jetzt am Kiosk!

0 Kommentare zu diesem Artikel
2066878