112758

Arbeitstiere im Dauereinsatz

07.09.2009 | 10:15 Uhr |

Der Ausfall von Servern kostet viel Geld – diese Aussage gilt inzwischen für Unternehmen jeder Größe und jeder Branche. Insbesondere kritische Prozesse in Produktion und IT müssen sich deswegen auf Systeme stützen, die ausfallsicher und hoch verfügbar sind.

Dem EDV-Super-GAU kann vorgebeugt werden, wenn bei der Auswahl wichtiger Server und ihrer Komponenten unbedingt auf Hochverfügbarkeit geachtet wird. Zumindest bei kritischen Unternehmensprozessen sind heute 24-Stunden-Verfügbarkeit an jedem Tag der Woche unabdingbar. Im Idealfall dürfen Netz oder Netzzugänge nie ausfallen, Server nie stillstehen und Daten nie unerreichbar sein. In der Praxis ist perfekte Verfügbarkeit zwar nie gewährleistet, doch für viele Firmen ist es wichtig, diesem Ideal möglichst nahe zu kommen.

Verfügbarkeiten werden gern in Prozentwerten gemessen: Standardkomponenten unter Linux erreichen heute eine Verfügbarkeit von 99,9 Prozent. Das klingt beeindruckend, reicht aber in der Praxis oft nicht. Denn immerhin lassen 99,9 Prozent einen Zugriffsverlust von 8,7 Stunden pro Jahr zu – sind es acht Stunden in der Geschäftszeit, kann dies zu lang sein. Eine der nächst höheren Stufen der Verfügbarkeit ist eine Ausfallsicherheit von 99,99 Prozent. Dies entspricht einem Systemausfall von etwa 50 Minuten pro Jahr. Auch dies ist für manche Einsatzgebiete noch zu viel. Als magischer Wert gelten »Five-Nine«: 99,999 Prozent Verfügbarkeit – also weniger als fünf Minuten Ausfall pro Jahr.

Ausfallsicherheit gibt es nicht umsonst, sie kostet Geld. Je höher die Sicherheit, umso mehr finanzielle Mittel müssen in die Systeme gesteckt werden. Davon sind nicht alle Unternehmen in gleicher Weise betroffen. Je kritischer aber ein Systemausfall für eine Firma ist, umso eher wird in eine höhere Ausfallsicherheit investiert. Auf der anderen Seite gibt es viele kleinere und mittelständische Unternehmen, für die weniger hohe Anforderungen ausreichen, etwa im Bereich Dateiablage, Drucken oder E-Mail. Sie kommen mit einfacheren Mitteln aus und brauchen weniger zu investieren.

Für mehr Speichersicherheit sorgt ECC

Bei der Verfügbarkeit spielen mehrere Komponenten eine Rolle. Basis ist aber die permanente Erreichbarkeit der entsprechenden Server. Wichtige Auswahlkriterien bei der Server-Hardware sind vor allem die Gesamt-Performance, die Skalierbarkeit, die Flexibilität und der Platzbedarf.

Vom Server-Design her genügt bei kleineren Unternehmen normalerweise schon ein Towersystem den Anforderungen. Um bei solchen Systemen Ausfälle durch defekten Hauptspeicher zu vermeiden, sollte der Server rudimentäre Sicherheitsmechanismen enthalten. Dazu gehört die Ausstattung mit ECC-Speicher (Error-Correcting Code). ECC-Module haben im Gegensatz zu normalen RAM-Bausteinen zusätzlich Funktionen, die den Datenfluss überprüfen und gegebenenfalls verändern können. Sie sind damit imstande, Fehler zu korrigieren.

ECC behebt Ein-Bit-Fehler und erkennt Zwei-Bit-Defekte. Dank der Ein-Bit-Fehlerkorrektur ignoriert der Server einen Ein-Bit-Fehler des Speicherchips auf einem DIMM-Speichermodul und läuft problemlos weiter. Laut einer IBM-Laborstudie erreicht ein mit ECC ausgestatteter Hauptspeicher eine Zuverlässigkeitsrate von 91 Prozent.

Höhere Speicherausfallsicherheit bietet das von IBM eingeführte Chipkill-Verfahren, auch als Advanced ECC bezeichnet. Es kann bis zu Vier-Bit-Fehler korrigieren und Acht-Bit-Fehler erkennen. Bei Fehlerhäufung in einem Speicherchip kann es diesen sogar ausblenden, ohne das System herunterzufahren.

Ein Vorteil der Chipkill-Technologie: Es sind keine speziellen Speichermodule notwendig, handelsübliche ECC-DIMMs genügen. Zusätzlich arbeitet das Korrekturverfahren unabhängig vom installierten Betriebssystem und hängt somit nur vom Chipsatz und vom BIOS ab. Das Chipkill-Verfahren erreicht nach der IBM-Studie eine Ausfallsicherheit von 99,94 Prozent.

Sollen Speicherintegrität und -ausfallsicherheit noch weiter gesteigert werden, bieten entsprechende Chipsätze und Betriebssysteme zusätzliche Technologien wie Hot Swap, Hot Add, Hot Spare Memory, Memory Mirroring oder ProteXion.

0 Kommentare zu diesem Artikel
112758