Sitemap

Einführung und Übersicht

SearchEngineOptimizing - SuchMaschinenOptimierung (Okt 2014)

Sitemap.xml


Mitte 2005 wurde  von Google die Sitemaps-Technologie veröffentlicht. Ziel der Technologie ist es, den Suchmaschinen ein Inhaltsverzeichnis der jeweiligen Webseite bereitzustellen. Die Technologie wurde auch von MSN und Yahoo! übernommen, womit sie  de facto Standard wurde.  Ist keine Sitemap vorhanden, findet der Crawler nur zufällig neue bzw. aktualisierte Seiten und kann diese indizieren, da er diese sonst nur über die Verfolgung interner bzw. externer Links finden kann. Womit wir wieder beim Thema der internen Verlinkung wären.


Sitemaps werden in XML erstellt. Eine sehr exakte Beschreibungssprache, bei der praktisch keine syntaktischen Fehler erlaubt sind. Eine manuelle Erstellung, ist bei kleinen, statischen Webseiten vielleicht noch vorstellbar, aber selbst da schon unpraktisch. Denn jede Änderung der Struktur erfordert eine Neuverfassung der Sitemap.xml.


Die Sitemap.xml wird im Stammverzeichnis deiner Webseite abgelegt. Wenn  du deine Domain selbst gekauft hast und deinen Webspace woanders liegen hast, ergibt sich daraus das Problem, das die Sitemap nicht im Stanmmverzeichnis deiner Domain liegen kann, weil du keinen Zugriff auf dieses hast. Damit erfolgt durch Google keine Zuordnung der Unterseiten deiner Webseite zur Domain, sondern nur zum Verzeichnis deines Providers. Ein echter Nachteil im Sinn von SEO.


Für die Erstellung einer Sitemap gibt es, von der manuellen Erstellung abgesehen, zwei Möglichkeiten. Zum einen externe Tools, die die Webseite crawlen und eine Sitemap erstellen. Zum anderen bieten gute CMS-Systeme der meisten Provider, integrierte Plugins die eine Sitemap standardmäßig erstellen und aktualisieren.

Beispiel einer Sitemap:


<urlset xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9

<url>

<loc>http://www.webseite.de</loc>         

<lastmod>2012-10-10</lastmod>           

<changefreq>monthly</changefreq>           

<priority>0.8</priority>

</url>

</urlset>


Der Suchmaschine werden also neben der einzelnen Seite auch Informationen geliefert, wann die Seite das letzte mal aktualisiert wurde, wie oft diese aktualisiert wird und welche Priorität diese im Projekt hat.

Wichtig ist natürlich darauf zu achten, dass wirklich nur die Seiten aufgenommen werden, die auch indiziert werden sollen. Seiten die zum Beipiel hinter einem Loginbereich liegen dürfen hier logischerweise nicht erscheinen. Darauf ist besonders zu achten, wenn die sitemap von einem CMS automatisch erstellt wird.


Für Videos, Bilder, News und Mobile-Seiten gibt es bei Bedarf separate Abschnitte, die bei größeren Projekten auch als separate sitemap-Dateien gespeichert werden können.


Grundsätzlich reicht es, die Sitemap im Stammverzeichnis abzulegen. Sie wird gefunden wenn der GoogleBot mal wieder vorbeikommt. Wer sein Projekt aber ernsthaft betreibt und forcieren möchte, kann sich bei Google anmelden und die Sitemap über die Webmaster-Tools direkt anmelden. Zwischen Anmeldung und Indizierung liegen ca. 2 Tage. Bei vielen Unterseiten eines Projektes werden diese stückweise indiziert mit jeweils 1-2 Tagen Pause dazwischen. Bei anderen Suchmaschinen wie z.B. Bing ist die manuelle Anmeldung ebenfalls möglich.



Weiter zum Punkt - Tools