Logfiles überwachen
Die beste Strategie gegen Störungen im Server ist dessen sorgfältige Überwachung. Dies erleichtert die frühzeitige Erkennung von Fehlern. Zwei Werkzeuge helfen Ihnen, die Informationsflut aus den Log-Dateien unter Kontrolle zu halten:
logguardian, ein Werkzeug, das eine oder mehrere Log-Dateien nach bestimmten Zeichenketten durchsucht. Das zweite Tool ist
logcheck. Damit bereinigen Sie Log-Dateien von häufig wiederkehrenden, aber unwichtigen Meldungen.
Liste der geöffneten Dateien
Bevor Sie mit den Rettungsmaßnahmen an einem defekten Dateisystem beginnen, sollten Sie sicherstellen, welche Dateien und Verzeichnisse gerade aktiv und geöffnet sind. Hierzu dient der Befehl lsof. Mit "lsof /home" untersuchen Sie, welche Dateien und Verzeichnisse im Home-Verzeichnis gerade geöffnet sind. Stellen Sie sicher, dass keine oder zumindest so wenig Dateien wie möglich offen sind, bevor Sie mit der Wiederherstellung des Verzeichnisses oder der Partition beginnen. Ansonsten kann die Restaurierung scheitern.
Liste der aktiven Prozesse
Das im vorherigen Tipp Gesagte gilt auch für die Prozesse, die aktuell auf ein beschädigtes Dateisystem zugreifen. Mit dem Befehl "fuser" ermitteln Sie, welche Programme und Dienste aktiv sind. Mit "fuser -m /home" erhalten Sie eine Ausgabe wie:
/home: 2320c 2375c 2384c 2397c 2399c 2403c 2405c 2412c 2428c 2451c 2506c 2557c 2558c 2559c 2688e 2690c 3173c 3346c
Bei diesen Nummern handelt es sich um die auch als PIDs bezeichneten Prozess-IDs der laufenden Programme und Dienste, die gerade auf das Verzeichnis "/home" zugreifen. Mit dem Befehl
ps -axlw | grep 2320
erhalten Sie anschließend weiterführende Informationen zum ersten Prozess des obigen Listings: In unserem Beispiel greift gnome-session auf "/home" zu.
ddrescue hilft weiter
Nach einem Festplatten-Crash sind alle unmittelbar durchgeführten Operationen und Rettungsversuche, die das Ziel haben, Daten wiederherzustellen, gefährlich. Fehler, die sich während der Rettung einschleichen, können im Extremfall noch mehr Daten zerstören. Um dies zu vermeiden, ist der Einsatz von ddrescue ratsam. Mit diesem Werkzeug, das in allen gängigen Linux-Distributionen standardmäßig als Paket zur Verfügung steht, können Sie eine beschädigte Partition in eine Datei oder auf eine neue Partition schreiben. Wollen Sie etwa die nicht mehr reibungslos funktionierende Festplatte "hda" komplett auf die neue Harddisk "hdb" kopieren, führen Sie diesen Befehl aus:
ddrescue —max-retries=-1/dev/hda/dev/hdb
Der Parameter "-max-retries=-1" führt übrigens dazu, dass die Hardware-Fehler beim Kopieren ignoriert werden. Alle weiteren Rettungsaktionen können Sie dann direkt auf der kopierten Festplatte durchführen.
Festplatten überwachen
Moderne (S-)ATA- und SCSI-Festplatten sind mit einem eingebauten Diagnose-System namens SMART?ausgestattet. Mit dessen Hilfe lassen sich Ausfälle der Platte frühzeitig erkennen. Unter Linux sorgt das Werkzeug smartctl für die Überwachung solcher Festplatten. Rufen Sie beispielsweise
smartctl -i /dev/hda
auf, um Informationen über die erste ATA-Festplatte ("hda") des Systems abzurufen. Mit der Option "-a" erhalten Sie noch detailliertere Informationen zur Festplatte. Wollen Sie hingegen die Funktionalität der Festplatte prüfen, tippen Sie
smartctl -H /dev/hda
ein. Für die Überwachung der SMART-Festplatten ist der smartd-Daemon zuständig. Details zur Konfiguration entnehmen Sie der Anleitung Ihres Betriebssystems.
Im zweiten Teil unseres Beitrags mit Tipps für Administratoren geht es um Sicherheit bei SSL- und VPN-Verbindungen sowie um Sicherheit im Netzwerk. Er erscheint am Vormittag des 1. August.
Lesen Sie in diesem Beitrag