Tipps zur Suchmaschinenoptimierung - Kapitel "Optimierungstechniken"
URL-Rewriting für suchmaschinenfreundliche URLs
Genau wie der Titel einer Seite ist auch deren Adresse ein übergeordnetes Merkmal, anhand dessen ein Besucher und eine Suchmaschine Rückschlüsse auf den Inhalt der Seite ziehen können. Jedenfalls im Idealfall. Der Beitrag zur Optimierung von Webseiten-Adressen nennt die wichtigsten Faktoren für eine „gute“ Seitenandresse. Warum nicht jede URL gleich von Anfang an optimal gestaltet ist und was Sie tun können, um den Aufbau Ihrer URLs „nach außen“ zu optimieren, zeigt dieser Beitrag.
Viele Webpräsenzen bestehen nicht aus statischen HTML-Seiten, die schon in der Form auf dem Server vorliegen, in der diese beim Betrachter im Browser ankommen. Vielmehr werden die Inhalte in einem Content Management System verwaltet und in einer Datenbank gespeichert. Technologien wie zum Beispiel PHP, ASP.NET und andere dienen dann dazu, die Inhalte wieder in HTML-Seiten umzuwandeln, wenn diese „angefragt“ werden. Auf diese Weise werden Seiten (besonders bei größeren Websites und Onlineshops) komplett dynamisch generiert, wenn sie gebraucht werden. Zur Formatierung und Vervollständigung einer Seite werden vorgefertigte Schablonen (so genannte Templates) verwendet. Vorteil dieser dynamischen Methode ist, dass alle Inhalte einmal zentral gepflegt und abgerufen werden. Das ist einerseits zwar sehr praktisch, andererseits erlauben diese automatisch erstellten URLs oft keinerlei Rückschluss auf den Inhalt einer Seite, weil die Adresse oft nur den „Produzenten“ für die Inhalte anspricht und in Form mehr oder weniger kryptischer Parameter bestimmt, welche Inhalte abgerufen und dargestellt werden sollen. Im schlimmsten Fall gefällt einer Suchmaschine eine solche Adresse so wenig, dass Sie die dahinter erreichbaren Inhalte komplett ignoriert.
Probleme bei der Indizierung dynamischer Webseiten in den Suchmaschinen
Für dynamische Webseiten kann es also durchaus Nachteile bei der Indizierung in den Suchmaschinenergebnissen geben (Details zum Thema „Wie Suchmaschinen Daten sammeln“ finden Sie im zugehörigen Beitrag). Als dynamisch „erkennbare“ Seiten haben auch das Problem, dass Suchmaschinen solchen Adressen gern misstrauen, weil sich dahinter gern Inhalte verbergen, die morgen schon nicht mehr dort zu finden sind. Wenn aber Aktualität und Verfügbarkeit einer Information nicht gewährleistet werden kann, bedeutet dies einen möglichen Nachteil für die Suchmaschine, wenn die Seite dennoch in den Suchergebnislisten aufgeführt wird, ohne die gesuchte Information bieten zu können.
Außerdem können sich URLs, die mit vielen Parametern versehen sind, negativ auf den PageRank (alle Details zum Thema PageRank finden Sie im Beitrag „Der PageRank und wie man ihn verteilt“ ) auswirken, wenn die Verteilung zwischen den einzelnen Seiten einer Domain auf Grund „unschöner“ URLs nicht funktioniert. Daher sollten dynamische URLs zumindest so kurz wie möglich ausfallen und nur wenige Parameter benötigen.
Eine weitere Gefahr, die eigentlich gar nichts mit der Adresse der Seite zu tun hat, lauert übrigens in den Templates. Wird zu viel Inhalt einer Seite vom „Rahmen“ bestimmt, der für alle Seiten gleich aufgebaut ist (also nicht nur Kopf, Navigation etc., sondern auch längere Textinhalte, die zusammen mit dem „eigentlichen“ veränderlichen Seiteninhalt auf jeder produzierten Seite ausgegeben werden), erkennt die Suchmaschine allzuviele Ähnlichkeiten zu anderen Seiten und nimmt daher neue Seiten ggf. gar nicht mehr in den Index auf. Oder die Seite wird zwar verschlagwortet, erhält aber durch die Ähnlichkeit zu vielen weiteren Seiten eine geringe Relevanz zugeordnet.
Das Hauptproblem bleibt aber die Tatsache, dass die Parameter fast immer aus Zahlen bestehen, die den entsprechenden Eintrag in der Datenbank des CMS referenzieren. Da ist also kein Platz mehr für Keywords, die man so gern in die Adresse einer Seite übernehmen möchte.
Lösung: URL-Rewriting
Zur Lösung des Dilemmas müssen solche unschönen Adressen „umgeschrieben“ werden. Dabei wird nicht das eigentliche System verändert, nach dem ein Seitenname aufgebaut wird, sondern es wird eine Art „Übersetzer“ zwischengeschaltet. Dieser wandelt eine Adresse nach bestimmten Regeln um, so dass die „eigentliche“ Adresse der Seite wieder verwendet werden kann, um die gewünschten Inhalte aus der Datenbank abzurufen, anschließend die Seite zu produzieren und dann zurückzuliefern. Eine umgeschriebene Adresse dient so als Alternative zur rechten Adresse und führt zum gleichen Ziel. Der „Übersetzer“ kennt entweder einen Satz von Regeln, nach denen eine Alternativadresse zerlegt und wieder in die richtige Adresse umgewandelt werden kann, oder es ist für jede einzelne Seite eine „Übersetzungsanweisung“ vorhanden.
Um zu vermeiden, dass eine Suchmaschine an die „unfreundliche“ Adresse gerät, muss dafür gesorgt werden, dass sich alle internen Links auf eine Seite der umgeschriebenen Adresse bedienen und nicht die reale Adresse mit den eher nutzlosen Parametern verwendet.
Daher werden für größere Webseiten Content Management– und Shop Systeme oft bereits passende Module und Erweiterungen angeboten (wenn diese nicht zum Standardumfang gehören), die sich dieser Technik bedienen, um suchmaschinen- und benutzerfreundliche Seitenadressen zu erzeugen. Dazu wird zumeist auf den Titel der Seite zurückgegriffen, welcher als neuer Seitenname verwendet wird. Je nach Technik wird dieser Titel dann noch durch eine Zahl an einer fest vorgegebenen Position ergänzt, die dem entsprechenden Parameter der unveränderten Seitenadresse entspricht.
Wird eine solche Seitenadresse aufgerufen, wird diese Zahl (als Referenz auf den passenden Datenbankeintrag) wieder aus dem künstlichen Seitennamen nach dem bestehenden „Regelwerk“ ausgelesen und zum Abrufen der gewünschten Information verwendet. Alternative Methoden führen eine interne Tabelle mit realen Seitenadressen und deren suchmaschinenfreundlichen Pendants, so dass auf die Platzierung einer eindeutigen Nummer in der Adresse verzichtet werden kann. Das Ziel ist es hierbei aber immer,
- den Pfad zu einer Seite möglichst kurz zu halten (möglichst wenige verzweigte Verzeichnisse),
- die relevanten Keywords in den Namen der Seite zu bringen,
- Parameter möglichst vollständig zu eliminieren und
- dem Seitennamen möglichst ein „statisch aussehendes“ Format zu geben.
Der letzte Punkt wird zumeist dadurch abgedeckt, dass die Erweiterung des Seitennamens nicht durch „.asp“, „.php“ oder ähnliche Kürzel auf eine dynamische Seite hinweist, sondern in „.html“, „.htm“ etc. umgewandelt wird, was statische Inhalte symbolisiert.
So wird z. B. aus einer Originaladresse wie
www.musterurl.de/index.php?inhalt=muster&beschreibung =urlrewrite
nach dem Umschreiben eine Adresse wie
www.musterurl.de/muster-urlrewrite.html
verwendet, um die Seite abzurufen. Oder es wird aus
www.musterurl.de/html/cmsxx/default.aspx?lang=de?pageid=88
mit entsprechenden Mitteln und dem Titel der Seite eine neue Adresse
www.musterurl.de/de-88/muster_fuer_urlrewrite.html
geformt.
Damit eine solche Optimierung funktioniert, muss das eingesetzte CMS in der Lage sein, auch intern die neuen Adressen zu kennen und zu benutzen. Bei „selbsterstellten“ Seiten ist es demnach ggf. notwendig, die alten Adressen gegen die neuen auszutauschen, wo immer Links vorhanden sind. Also nicht nur in der Navigation, sondern auch bei Deeplinks im Inhalt einer Seite etc.
Dazu dient bei den meisten Content-Management-Systemen, Blogs und Online-Shops eine entsprechende Option in den Einstellungen, die expilizit aktiviert werden muss. Andere Systeme benötigen eine Erweiterung, die je nach System „Suchmaschinen – Plug-In“, „SEO-AddIn“, „URL-AddOn“ oder eine ähnliche Bezeichnung trägt. Nach Installation und Aktivierung werden die alten Adressen systemintern gegen lesbare URLs ausgetauscht.
Rewrite-Engines
Damit die neuen Adressen zum gewünschten Ziel führen, muss der Server in der Lage sein, diese wieder zu übersetzen. Die dazu erforderlichen Funktionen sind bei vielen Webservern schon vorhanden und müssen nur genutzt werden – sonst sind eine Anpassung des Servers und ein Nachinstallieren der betreffenden Module erforderlich. Bei einer Website, die auf einem Server gehostet wird, auf dessen Konfiguration Sie selbst keinen Zugriff haben, kann Ihnen dieses Mittel also durchaus verweigert bleiben. Auch die oben genannten Module müssen oft auf die Hilfe einer speziellen Serverfunktionalität zurückgreifen, wenn das Übersetzen in beide Richtungen nicht direkt im System geschehen kann. Eine so gennannte „Rewrite-Engine“; eine Maschine zum Umschreiben der URLs, muss also her.
Die bekannteste Rewrite-Engine ist mod_rewrite. Dies ist ein Modul für die Manipulation und Abwandlung von URLs, die zum „Apache – Server“ gehört. Es steht Ihnen also in der Regel auf Servern zur Verfügung die mit Apache (unter Linux) betrieben werden. Die Anweisungen zum Umschreiben von Adressen werden dann in einer einfachen Textdatei namens .htaccess (die noch viele weitere Aufgaben auf dem Server übernimmt) abgelegt. Der Einsatz (wenn er denn nicht komplett vom CMS gesteuert wird) ist nicht ganz einfach, so dass Sie eigene Versuche lieber erst einmal auf einem lokalen System oder zumindest in einem Unterverzeichnis Ihres Webauftritts durchführen sollten, bis Sie sich an den Livebetrieb wagen. Vielseitig einsetzbar ist das Modul allemal, nur setzt dies (leider) auch für kompliziertere Fälle einige Erfahrungen mit „Regulären Ausdrücken“ voraus. Lassen Sie sich davon aber nicht abschrecken und experimentieren Sie an sicherer Stelle ruhig ein wenig mit dem Modul, wenn Ihre Seitenadressen dies erfordern. Konkrete Beispiele und weitere Informationen zum Einsatz von mod_rewrite finden Sie viele im Web – z. B. hier, hier oder dort 😉
Auch wenn Sie einen anderen Server einsetzen, finden sich in der Regel ähnliche Module. Kompatibel zum Apache „.htaccess / mod_rewrite – Gespann“ bietet z. B. das Tool ISAPI_Rewrite ähnliche Möglichkeiten zum Umschreiben von URLs für den Internet Information Server (IIS), der unter Windows zuhause ist. Auch andere Alternativen ermöglichen je nach eingesetzter Server- und CMS-Technologie die Optimierung wie z. B. der URL-Rewriter für .NET.