Reguläre Ausdrücke (Regular Expressions oder Regex) kommen immer dann zum Einsatz, wenn nach Informationen gesucht wird, die einem bestimmten Grundmuster folgen, dabei aber sehr variabel sein können. Entwickler nutzen Regex beispielsweise zur Überprüfung von gültigen Eingaben in Formularen. Auch in Datenbanken, Tabellenkalkulationen oder der Textverarbeitung erweist sich Regex als Problemlöser, wenn nach einem Muster statt nach einem konkreten Inhalt gesucht wird. Das kann etwa eine mit Tabulatoren getrennte Namensliste sein, die nach Vor- und Nachnamen sortiert ist, was Sie aber gern umdrehen würden.
Den richtigen Ausdruck finden
Es gibt verschiedene „Dialekte“ bei den regulären Ausdrücken, wie sie von Programmiersprachen verwendet werden. Die Unterschiede sind dabei marginal, wer also das Prinzip verstanden hat, wird schnell erkennen, wie er einen einmal gefundenen Ausdruck umformulieren muss. Genau das beschreibt aber schon das Hauptproblem, das viele Anwender bei der ersten Begegnung mit Regex haben: den passenden Ausdruck zu finden. Wenn Sie zu den Einsteigern gehören, lohnt sich der Besuch der englischsprachigen Seite https://www.regular-expressions.info/ , auf der eine ganze Reihe von Tutorials und Hinweisen gesammelt sind, um sich mit der Mechanik vertraut zu machen.

Ein sehr vielversprechendes Projekt ist der Service Regex Online Generator von Olaf Neumann. Die Funktionsweise ist erstaunlich einfach. Das Tool unterstützt Sie dabei, aus einem Muster den (wahrscheinlich) passenden Ausdruck zu isolieren. Diese Einschränkung muss insofern sein, als die Seite naturgemäß nicht wissen kann, wonach Sie tatsächlich suchen. Um diesen Dienst zu testen, wurde ein realer Datensatz gewählt: Bei der Durchsicht der Systemprotokolle eines Mac-Systems zeigte sich häufiger das plötzliche Absterben einer Anwendung. Wie unter Linux ist das Systemlog sehr umfangreich und unübersichtlich. Um schneller alle Fundstellen zu identifizieren, bietet sich ein regulärer Ausdruck an.
Kopieren Sie also etwa die Fehlermeldung, die gesuchten Begriffe oder eine Zahlenkombination in die Zwischenablage und fügen Sie den Inhalt in das erste Feld der Webseite ein. Ihre Eingabe wird analysiert. In der zweiten Zeile sehen Sie jetzt eine ganze Reihe von farbigen Markierungen. Diese sind unterschiedlich lang und beziehen sich damit auf verschiedene Teile des Ausgangsmaterials. Was das Tool erkannt zu haben meint, erscheint als Hinweis, wenn Sie mit der Maus auf einer der farbigen Markierungen zeigen.

Die Erläuterungen sind zwar in englischer Sprache, aber absolut verständlich. Sobald Sie auf diese Weise ein Muster mit einem Mausklick auswählen, stellt das Werkzeug den darauf basierenden regulären Ausdruck zusammen. Dieser erscheint in der dritten Zeile „Regular expression“. Dort finden Sie noch zwei wichtige Optionsfelder. Da das Tool nicht wissen kann, ob Sie Ihre Eingabe lediglich als Muster nutzen wollten oder tatsächlich nach einer Kombination aus freier Suche und dem Rest der Eingabe suchen, können Sie hier wählen.
- „Generate only patterns“ verwirft beim Erzeugen des regulären Ausdrucks alles, bis auf den Teil, den Sie mit der Maus ausgewählt hatten. Ansonsten werden alle Teile kopiert.
- „Match whole line“ berücksichtigt zusätzlich oder optional auch noch die Stellung des Suchmusters.
Mit „Copy regex“ landet der gefundene Ausdruck in der Zwischenablage. Wer den Ausdruck in einem besonderen Dialekt einer Programmiersprache benötigt, dürfte sich über den unteren Bereich des Bildschirms freuen. Denn dort erscheint dann der Regex-Ausdruck in der gewünschten Syntax.

Txt2regex als Alternative für die Konsole
Während das gerade vorgestellte Werkzeug bereits viel Arbeit dadurch abnimmt, indem es den Suchausdruck gruppiert und analysiert, ist das zweite Tool für reguläre Ausdrücke etwas schlichter. Dafür gehört es zu den Paketen der meisten Distributionen und kann rasch installiert werden. Txt-2regex läuft im Terminal. Das Tool, das Sie über den Programmnamen direkt auf der Konsole starten, nutzt die Technik einer Befragung, um Sie schrittweise zum regulären Ausdruck zu führen. Dazu blendet es stets eine Reihe von Optionen an oder fordert Sie zu einer Eingabe auf. So müssen Sie im ersten Schritt die Frage beantworten, ob sich der gewünschte Ausdruck am Anfang einer Zeile oder an beliebiger Stelle befinden darf. Haben Sie Ihre Auswahl getroffen, bietet es Optionen an. Suchen Sie nach einem beliebigen oder bestimmten Zeichen? Oder soll es sich um eine ganze Zeichenfolge (oder Wort) handeln?

Sie können auch eine Liste von erlaubten Zeichen definieren. In Abhängigkeit Ihrer Eingabe fordert Sie das Programm dann dazu auf, die Zeichenfolge oder die Liste der erlaubten Zeichen zu hinterlegen. Wenn Sie beim Programmaufruf keine weiteren Parameter übergeben haben, zeigt txt2regex am oberen Bildschirmrand Ihren regulären Ausdruck zur Verwendung in verschiedenen Programmen an. Zwar mag die Software auf den ersten Blick altertümlich erscheinen (tatsächlich wurde die erste Version vor 20 Jahren vorgestellt), was ihren Nutzen aber nicht schmälert.
Die Besonderheit besteht darin, dass Sie die Fragen nur dann beantworten können, wenn Sie sich mit dem, was Sie suchen, auch bereits intensiver auseinandergesetzt haben, also das dahinter stehende Muster erkannt haben. Der angenehme Nebeneffekt: Je häufiger Sie mit txt2regex gearbeitet haben, desto sicherer werden Sie in der Nutzung regulärer Ausdrücke werden, um später ohne weitere Hilfsmittel auszukommen.
Regex bleibt anstrengend
Txt2regex und Regex Online Generator : Gerne hätten wir diese Hilfsmittel ergänzt durch weitere Programme, mit denen sich Regex wie von Geisterhand bauen lässt. Aber die Unterstützung bleibt rar. Bei der Recherche in den Paketquellen werden Sie auch noch auf das Tool Rgxg stoßen, das aber nur Ausdrücke für wenige spezielle Suchen produziert, die im Alltag – jenseits der Entwicklung von Software – keine große Rolle spielen.
Wenn Sie abseits von Linux in den App Stores von Microsoft oder Apple nach „RegEx“ oder „Regular Expressions“ suchen, finden Sie eine ganze Reihe von grafischen Apps, die die Zusammenstellung von Regex vereinfachen wollen. Genauso wie der Einsatz des vorgestellten des Regex Online Generator bedeutet das aber nicht zwangsläufig, dass Sie immer das finden werden, was Sie suchen. Werkzeuge, die auf Basis einer Texteingabe versuchen, einen regulären Ausdruck abzuleiten, tun dies näherungsweise und auf Basis von festen Regeln (und ihrerseits mit regulären Ausdrücken). Dabei kommt es zwangsläufig zu Unschärfen. Mit dem vorgestellten txt2Regex ist diese Gefahr deutlich geringer, weil das Tool den Entwicklungsprozess beim Zusammenstellen eines Regex nachbildet, also so vorgeht, wie Sie dies gedanklich auch tun.
Siehe auch: Richtig suchen – Google & Co. voll ausreizen