Channel Header
45962

Effektiv filtern mit regulären Ausdrücken

Für die Filterung von Spam interessant ist neben dem Nachrichtentext ("Body") der Nachrichtenkopf ("Header") einer Mail, der Empfänger, Absender, Betreff und eine Reihe weiterer Angaben enthält. In einem grafischen Mail-Client sehen Sie standardmäßig nur Betreff, Absender, Empfänger und natürlich den Nachrichtentext. Um die Header komplett anzeigen zu lassen und damit genauen Aufschluss über Art und Herkunft einer Mail zu erhalten, müssen Sie den Quelltext der Nachricht öffnen.

In KMail erledigen Sie dies über den Menüpunkt "Ansicht, Vorspann, Alle". Nun sehen Sie die Mailadresse des Absenders ("From:"), den Betreff ("Subject"), den genauen Weg, den die Mail genommen hat ("Received from:") und verschiedene Angaben zur Codierung und zum verwendeten Zeichensatz ("Content-Type").

Wollen Sie selbst Filterregeln für Spammails definieren, tun Sie dies am besten anhand der Header-Angaben. Spamversender nutzen allerdings selten mehrmals die gleiche Absenderadresse und verändern fortwährend den Wortlaut ihrer Nachrichten, um Wortfilter zu täuschen. Um mit einer Regel auf unterschiedliche Absender oder Schreibweisen typischer Spamwörter zu filtern, verwenden Sie verschiedene reguläre Ausdrücke. Dies sind Zeichen, die als Platzhalter für bestimmte Muster und Wortmengen dienen.

Einige Beispiele für Platzhalter sind:

Punkt(.) steht für ein beliebiges Zeichen
Stern (*) das vor dem * stehende Zeichen darf beliebig oft vorkommen
Punkt und Stern (.*) eine beliebige Anzahl beliebiger Zeichen
Eckige Klammern ([Aa]) entweder "A" oder "a"

From: .*.de
erfasst also alle Nachrichten mit Absendern aus dem de-Domain-Bereich.

Subject: .*Money
erfasst alle Nachrichten, in denen "Money" im Betreff auftaucht.

Body:[Cc][Aa][Ss][Hh]
erfasst alle Nachrichten, die im Text "Cash" – oder "cAsh", "CASH", "casH" und so weiter – enthalten.

Mit diesen und anderen regulären Ausdrücken lassen sich die Standard-Wortfilter von Mailprogrammen wie KMail oder Evolution entscheidend verbessern und damit dann deutlich höhere Trefferquoten beim Aussortieren von Spammails erzielen.

PC-WELT Marktplatz

0 Kommentare zu diesem Artikel
45962