Tipps zur Suchmaschinenoptimierung - Kapitel "Optimierungstechniken-Verlinkung"
Weiterleitungen für veränderte URLs suchmaschinenfreundlich einrichten
Wenn eine Seite ihren Namen ändert, sich die Struktur einer Domain – z. B. durch Einführung eines neuen CMS oder Aktivierung eines anderen Moduls zur dynamischen Anlassung der Seitenadressen – verändert oder die ganze Domain umzieht, besteht immer das Problem, dass die Suchmaschine die alte Adresse kennt und in den Suchergebnissen anbietet, während die Information nur noch unter neuer Anschrift auffindbar ist. Aus diesem Grund – und da möglichst der PageRank und die bereits erzielte Aufmerksamkeit der „alten“ Seite erhalten bleiben soll – ist es wünschenswert, der Suchmaschine das neue Ziel mitzuteilen.
Wie schon mehrfach angesprochen, dient dazu idealerweise eine „301-Weiterleitung“, die dafür sorgt, dass alle Besucher (Suchmaschinen und Browser) die neue Adresse mitgeteilt bekommen, wenn die alte aufgerufen wird. Und dass der „Besucher“ weiß, dass dieser Umzug dauerhaft ist.
Dazu wird in der Datei .htaccess im Rootverzeichnis des Servers für jede alte Adresse ein Eintrag mit der neuen Adresse benötigt, die dazu dient, die Weiterleitung zu steuern. Auch für mit Windows IIS betriebene Server existieren entsprechende Mittel zur Weiterleitung; hier soll aber die für den Großteil der Linux-Server gültige Variante beschrieben werden:
Redirect 301 /alteseite.php http://www.meinedomain.de/neueseite.html
Bei der neuen Adresse muss also immer der komplette Pfad inkl. Protokol und Domainnamen angegeben werden. Die alte Adresse, bei deren Aufruf auf die neue URL verwiesen werden soll, beginnt mit dem „/“, welches für das Wurzelverzeichnis des Servers steht. Ist die Adresse einer alten Seite also z. B. http://www.meinedomain.de/shop/kategorie/artikel1.htm, lautet der entsprechende Eintrag für die alte Seite „/shop/kategorie/artikel1.htm“.
In vielen Fällen wird aber bei Veränderung an einer oder aller Adressen der Seiten einer Website vergessen, sich um solche Weiterleitungen zu kümmern. Bestenfalls landet dann der Besucher aus einer Suchmaschine, der auf einen Treffer mit der veralteten Adresse klickt, auf einer aussagekräftigen Fehlerseite, ansonsten zeigt der Browser nur seine übliche Misserfolgsmeldung. Aus Sicht einer Suchmaschine sieht es noch schlimmer aus, denn der für „verschwundene“ oder aus anderen Gründen nicht vorhandene Statuscode „404“ bedeutet: Das gibt es hier nicht. Und dies führt zur Löschung aus dem Index: Keine Klicks, kein PageRank, der auf die neue Seite übergehen kann, zurück auf „Los“.
Eine größere Umstrukturierung benötigt daher eine gewisse Vorbereitung. Generell ist es natürlich nur für diejenigen Adressen erforderlich eine Weiterleitung einzurichten, auf die über externe Links oder Suchergebnisse zugegriffen werden kann. Und für Suchergebnisse sind nur die Seiten relevant, die die Suchmaschine kennt. Wenn Sie also nicht nur eine oder ein paar Seiten umbenennen, deren Adressen Sie problemlos selbst in eine Liste füllen können, ist das erste Problem die Generierung einer Aufstellung aller relevanten alten Adressen. Beim Wechsel eines CMS kann oft eine geschickte Abfrage der Datenbank dazu dienen, diese Liste zu erhalten – oder Ihre alte Domain verfügte bereits über eine Sitemap, aus der Sie die Links extrahieren können. Wenn alles nichts hilft, kann zumindest eine Abfrage bei Google dazu dienen herauszufinden, welche Adressen dort bekannt sind. Dazu dient die einfache Abfrage von site:meinedomain.de und site:www.meinedomain.de bei Google. Wenn die Suchergebnisse gespeichert werden, können die Links dort manuell oder automatisiert (z. B. mittels Regular Expressions – fragen Sie den nächstbesten Programmierer, der ihnen über den Weg läuft ;)) ausgelesen werden. In den so erhaltenen Ergebnissen sind aber leider nicht alle Seiten aufgeführt, da Google es auf diesem öffentlich zugänglichen Weg nicht jedem ermöglichen möchte, die Abdeckung einer beliebigen Domain nachzuprüfen. Das ist zwar ärgerlich, aber nachvollziehbar und man bekommt so immerhin einen ersten Anhaltspunkt. Zum Glück gibt es aber bessere Alternativen, wenn die Domain in den Google Webmaster-Tools erfasst ist:
Generierung einer Umleitungsliste mittels Google Webmaster-Tools
Nach Auswahl der betreffenden Domain (bei mehr als einer verwalteten Site) kann über „Links“ in der Navigation auf der linken Seite in der nächsten Ebene die Option „Seiten mit internen Links“ gewählt werden. Hier sollte – allerdings nur, wenn die interne Verlinkung der Domain alle Seiten erfasst hat, und alle Seiten „irgendwie“ aufeinander „gezeigt“ haben und so alle Inhalte per Navigation erreichbar waren – eine mehr oder weniger komplette Liste aller URLs zu finden sein. Auch die Liste der Seiten mit externen Links ist ein ähnlich hilfreiches Werkzeug, denn genau diese Seiten (wenn sie denn nicht schon in der ersten Liste sind) sind für das Maß an PageRank verantwortlich, über das Sie derzeit verfügen.
Die Liste kann vollständig als CSV-Datei heruntergeladen werden. Nun muss in der Tabelle, z. B. in Excel – „nur“ noch eine zweite Spalte hinzugefügt werden, in der die neuen Seitenadressen eingetragen werden. Das ist leider in der Regel eine manuell zu verrichtende Arbeit, die viel Zeit in Anspruch nimmt – erledigen Sie des also unbedingt VOR dem Umzug und bestimmen Sie die neuen Adressen z. B. anhand einer Testinstallation des neuen CMS, wenn Sie im Begriff sind, umzusteigen.
Um nun aus der Liste der alten und neuen Adressen passende Einträge für eine .htaccess-Datei zu machen, müssen Sie nun lediglich noch eine weitere Spalte vor der ersten einfügen und „redirect 301“ in jede Zelle der Spalte füllen (dazu bietet Excel passende „Ausfüllfunktionen“ unter „Bearbeiten“. Die „alten“ Adressen beinhalten nun noch den Pfad der Domain, der per „Suchen und Ersetzen“ in der Spalte mit dem alten Namen eliminiert werden kann. Wird der Bereich nun markiert, kann er als Textdatei gespeichert werden; als Trenner verwenden Sie ein “ “ – Leerzeichen. Wer die entsprechenden Optionen nicht findet, macht es sich auf folgendem Weg „einfach“:
Den kompletten gefüllten Block (von Spalte A bis C) über alle gefüllten Zeilen markieren, mit STRG + C kopieren und per STRG + V in ein leeres Textdokument in den Windows – Editor (Start – Ausführen – „notepad“) einfügen. Dort markieren Sie nun das erste unsichtbare „TAB“ zwischen „redirect 301“ und der Adresse in der ersten Zeile der Textdatei mit der Maus, kopieren dieses Zeichen wieder in die Zwischenablage und öffnen den Suchen und Ersetzen-Dialog von notepad. Ersetzen Sie nun (dazu den „TAB“ in das erste Feld per Zwischenbalage einfügen) den Tabulatorvorschub durch ein einfaches Leerzeichen. Das Ergebnis der Mühe kann nun wieder per Zwischenablage in die .htaccess – Datei des Servers eingetragen werden… aber bitte erst dann, wenn der Umzug vollzogen ist. Denn ansonsten würden die sofort nach dem Eintrag in die .htaccess-Datei aktiven Weiterleitungen zu den noch gar nicht existierenden neuen Seiten genau das Problem verursachen, welches Sie vermeiden wollten. Und auch nach dem Umstellen der Domain auf die neue Struktur sollten Sie unbedingt zumindest stichprobenartig ausprobieren, ob die Weiterleitungen funktionieren.