211416

Umbau der Website – WeiterleitungenDynamische Seiten – URL-Parameter

Der Umbau einer Website, etwa wegen eines Wechsels des Content-Management-Systems, erfordert besondere Maßnahmen. Denn viele der bisher gültigen URLs sind auch nach erfolgter Umstellung noch für einige Zeit – und das kann durchaus Wochen oder gar Monate dauern – in den Datenbanken der Suchmaschinen zu finden.

Richten Sie deshalb für jede (wichtige) Seite eine Weiterleitung von der bisherigen URL auf die neue URL ein. Achten Sie dabei darauf, dass diese Weiterleitung als permanente HTTP-Weiterleitung mit dem Statuscode 301 ausgeführt wird. Damit führen Sie nicht nur Nutzer auf die neue Adresse weiter, sondern teilen auch den Suchmaschinen-Robots mit, dass sie möglichst umgehend die neue URL an Stelle der alten aufnehmen sollen. Außerdem signalisieren Sie so den Suchmaschinen, dass Links, die auf die bisherige URL verweisen, nun der neuen URL zugerechnet werden sollen.

Besonders einfach lässt sich eine solche Weiterleitung im weit verbreiteten Webserver Apache in einer .htaccess-Datei umsetzen: Redirect 301 /alteUrl.htm http://www.ihresite.de/cms/neueUrl/

Beachten Sie dabei, dass das Weiterleitungsziel als absolute URL angegeben werden muss. Zwar müssen Sie bei einer solchen Umstellung immer damit rechnen, einiges an Suchmaschinen-Traffic einzubüßen; wenn Sie allerdings konsequent die beschriebenen Weiterleitungen setzen, sollte sich der Einbruch in Grenzen halten.

Sinnvolle Fehler-Seiten
Eine sinnvolle 404-Fehlerseite ist für eine professionell betreute Website immer ein Muss. Ganz besonders trifft dies aber für die Zeit nach einem Website-Umbau zu.

Denn trotz des Einsatzes von Weiterleitungen werden sich hier die "Seite nicht gefunden!"-Fehler häufen. Idealerweise enthält eine solche Seite neben einem netten Hinweis, dass hier etwas schiefgelaufen ist, prominent platzierte Links zur Homepage und, so vorhanden, zur Sitemap (Inhaltsverzeichnis). Ein Hinweis auf die hoffentlich vorhandene Suchfunktion ist ebenfalls nicht falsch.

Doch achten Sie beim Einrichten der Fehlerseite darauf, dass der Server tatsächlich auch den Fehlercode 404 zurückgibt. Denn ansonsten erkennen Suchmaschinen nicht, dass es sich um eine Fehlerseite handelt, und behalten die alten URLs munter weiterhin im Index – allerdings mit dem Inhalt der Fehlerseite. Damit können Sie sich etliche Probleme bis hin zum Ausschluss Ihrer Site vom Google-Index einhandeln.

Diese Art der Weiterleitung ist übrigens auch sinnvoll, wenn Sie eine ganz neue Domain benutzen möchten. Auch in diesem Fall sollten Sie für jede URL der alten Domain eine permanente Weiterleitung einrichten. Damit können Sie den PageRank der alten Website wenigstens zum größten Teil auf die neue Site übertragen.

Auf jeden Fall sollten Sie von dem Einsatz von JavaScript-Weiterleitungen absehen; auch eine Weiterleitung per Refresh-Meta-Tag ist nicht empfehlenswert. Beide Methoden werden so häufig von Spammern eingesetzt, dass Suchmaschinen Ihre Website als Spam betrachten und vom Index ausschließen könnten.

Suchmaschinen können heute problemlos mit dynamisch erzeugten Seiten umgehen; also mit Seiten, die mithilfe von Technologien wie PHP oder ASP erst zum Zeitpunkt des Seitenaufrufs vom Webserver erzeugt werden. Dafür typische Dateiendungen wie .php oder .asp akzeptieren heute alle wichtigen Suchmaschinen problemlos.

Schwieriger aber wird es, wenn man wirklich dynamische Seiten einsetzen will – also Seiten, deren Inhalte über einen Parameter gesteuert aus einer Datenbank generiert werden. Suchmaschinen nehmen heute zwar meist solche Fragezeichen-URLs auf, doch selbst bei Google kann es passieren, dass Ihre Seiten mit einem Fragezeichen in der URL nicht in die Datenbank gelangen. Nach welchen Kriterien Google bei der Entscheidung, Fragezeichen-URLs aufzunehmen, vorgeht, ist bis heute nicht bekannt.

Der Grund dieser Zurückhaltung ist durchaus nachvollziehbar: Man stelle sich nur vor, dass der Robot einer Suchmaschine die Ergebnisseiten einer anderen Suchmaschine indizieren würde. Das Resultat wäre, dass sich die beiden Suchmaschinen gegenseitig die Datenbanken kopieren würden – ein Schneeballeffekt, der in kurzer Zeit das Fassungsvermögen der beteiligten Computer sprengte. Ähnlich unsinnig ist die Indizierung von URLs, die Session-IDs enthalten. Schließlich ist die Session längst ungültig, bis die URL den Weg in die Datenbank gefunden hat.

Der typische Einsatz von dynamischen Webseiten liegt heute in Redaktionssystemen – und die bieten üblicherweise genau die Inhalte, die viele Surfer gern finden würden. Wie bringt man also Suchmaschinen dazu, eine dynamische Website aufzunehmen? Ganz einfach, man muss ihr eine statische Seite vortäuschen. Das heißt, alle nötigen Parameter muss die URL im Dateinamen bzw. im Pfad enthalten. Aus der URL einer Newsseite news.php?newsid=123 wird dann etwas wie news_123.php.

Nun müssen Sie nur noch dafür sorgen, dass bei Aufruf der Seite news_123.php auch die korrekte Seite angezeigt wird. Dazu gibt es zwei Möglichkeiten. Die erste Variante verlangt, dass für jede erzeugte Nachricht ein identisches Skript unter diesem Dateinamen abgelegt wird. Dieses Skript entziffert seinen eigenen Dateinamen und extrahiert daraus den Parameter zur Datenbankabfrage, in unserem Beispiel die newsid 123.mod_rewrite Die zweite Variante ist weitaus eleganter, allerdings muss dazu der Apache-Webserver mit dem Modul mod_rewrite im Einsatz sein. Dieses Modul ermöglicht es, dass jede URL vom Webserver anhand vorgegebener Regeln umgeschrieben wird.

Mit anderen Worten: Das Modul erzeugt aus der angeforderten URL news_123.php intern die URL news.php?newsid=123. Der Inhalt dieses Scripts wird dann ausgegeben, ohne dass der anfordernde Client etwas von der geänderten URL mitbekommt. Die dazugehörige Dokumentation finden Sie unter http://www.apache.org/docs/mod/mod_rewrite.html . Viele praxisnahe Beispiele sind auf dieser Website zusammengestellt: http://httpd.apache.org/docs/misc/rewriteguide.html .

Tipp: Für den Microsoft Webserver IIS gibt es von der Firma HeliconTech unter http://www.isapirewrite.com/ einen ISAPI-Filter, der dieselbe Aufgabe erfüllt wie mod_rewrite.

PC-WELT Marktplatz

211416