727073

Dokumente indizieren (I) - Schnell und effektiv in Dateien suchen

28.09.2006 | 10:13 Uhr |

Sie durchsuchen regelmäßig Archive mit Word-, Excel-, PDF- oder Textdateien. Die Windows-Suche reicht Ihnen dafür nicht aus, den Microsoft Index-Server finden Sie zu kompliziert und wenig komfortabel.

Anforderung:

Fortgeschrittener

Zeitaufwand:

Hoch

Problem:

Sie durchsuchen regelmäßig Archive mit Word-, Excel-, PDF- oder Textdateien. Die Windows-Suche reicht Ihnen dafür nicht aus, den Microsoft Index-Server finden Sie zu kompliziert und wenig komfortabel.

Lösung:

Eine schnelle und flexible Suchfunktion bietet das kostenlose Kommandozeilen-Programm :Swish-E . Damit erstellen Sie einen Such-Index für Ihre Dateien, in dem Sie die gewünschten Passagen schnell auffinden. Swish-E verarbeitet von Haus aus nur TXT-, HTML- und XML-Dateien. Über zusätzliche Filterprogramme kann es jedoch im Prinzip den Inhalt beliebiger Dateitypen in den Such-Index aufnehmen. Zum Lieferumfang gehören bereits Filter für PDF- und DOC-Dateien. Weitere Filter für XLS- und PPT-Dateien finden Sie im Programmpaket Catdoc . Eine grafische Oberfläche für Suchabfragen lässt sich ebenfalls realisieren. Lesen Sie dazu den morgigen Tipp (29.09.06).

Um einen Index zu erstellen, benötigt Swish-E eine Konfigurationsdatei. Erstellen Sie für Word-Dokumente eine Textdatei mit dem Namen Doc.Config mit dem Inhalt:

IndexFile "C:/<Verzeichnis>/doc.idx"IndexDir "C:/<Verzeichnis>"IndexContents TXT*.docIndexOnly .docFileFilter .doc C:/Programme/SWISH-E/lib/swish-e/catdoc.exe" –s8859-1 –d8859-1 "%P"

Hinter "IndexFile" gehört der Pfad zu einem Verzeichnis, das die Index-Dateien aufnehmen soll. Hinter "IndexDir" steht das Verzeichnis mit den Word-Dokumenten. Swish-E berücksichtigt automatisch alle Unterverzeichnisse. Die nächsten beiden Zeilen bewirken, dass das Programm DOC-Dateien als TXT-Dateien behandelt und nur Dateien mit der Extension DOC in den Index aufnimmt. "FileFilter" gibt das Kommando für die Umwandlung der DOC- in Textdateien an.

Dieser Schritt ist für das spätere Erstellen des Index nötig. Er ändert aber nichts an den bestehenden Dateiformaten. Beachten Sie, dass Swish-E bei den Pfadangaben Schrägstriche ("/") statt Backslashes ("\")erwartet. Beispieldateien für weitere Dokumenttypen finden Sie im Programmpaket :pcwSwish-E .

Sie starten die Indizierung auf der Kommandozeile mit

C:\Programme\Swish-E\Swish-e.exe -c <Pfad>\doc.config

Als <Pfad> geben Sie den Ordner an, in dem Sie die Datei Doc.Config angelegt haben. Ist der Index erstellt, starten Sie eine Suche:

C:\Programme\Swish-E\Swish-e.exe -f <Pfad>\doc.idx -w <Suchbegriff>

Für <Pfad> tragen Sie hier den Pfad ein, den Sie der Datei Doc.IDX in der Doc.Config zugewiesen haben. Für <Suchbegriff> können Sie ein oder mehrere Wörter eingeben. Mehrere Wörter werden automatisch als logisches "UND" interpretiert. Als Ergebnis erhalten Sie also nur die Dokumente, in denen alle Begriffe vorkommen. Mit "OR" zwischen den Begriffen finden Sie Dokumente, die alle oder einen der Suchbegriffe enthalten. Ausführliche Informationen zu den weiteren Möglichkeiten der Suchabfrage liefern die Hilfe-Dokumente im Installationsverzeichnis unter SWISH-E\share\doc\swishe\html.

0 Kommentare zu diesem Artikel
727073