Keine Woche ohne Neuigkeiten von Google, könnte man meinen. Diesmal lanchiert Google einen Service, der es Webmastern erleichtern soll, ihre Seiten indizieren zu lassen. Dazu bietet Google ein Tool an, mit dessen Hilfe Webmaster eine Übersicht ihrer Webseiten im XML-Format erstellen können. Diese XML-Datei wird dann bei Google eingereicht und soll als Grundlage für die Indizierung dienen.
Webmaster müssen sich für die Teilnahme an "Google Sitemaps" registrieren. Das Hilfsprogramm ist ein Python-Skript, das auf den Webserver kopiert und dort ausgeführt wird. Die Liste der vorgefunden Dateien enthält dann neben der jeweiligen Datei-URL auch Informationen wie Priorität, Datum der letzten Aktualisierung oder Aktualisierungsfrequenz, wie das von Google präsentierte Beispiel zeigt. Wer Probleme mit den Skript hat, kann alternativ auch eine einfache Textliste seiner Dateien erstellen.
Helfen soll der neue Service insbesondere bei der Indizierung von Websites, bei der die Spider allein Probleme haben, alle Seiten zu finden – ob wegen verteilter Server oder dynamischer URLs. Zudem soll die Qualität des Crawlings und damit der Suchergebnisse verbessert werden, da die Webmaster über ihre Filelisten Zusatzinformationen mitteilen. Diese Serviceverbesserung will Google übrigens auch anderen Suchmaschinen zugestehen – im Google Blog wird versichert, dass man die neue Technik auch anderen Suchmaschinen verfügbar machen will.
Der neue Dienst ist noch im Betastadium und selbstverständlich bietet er keinerlei Garantien auf Art und Umfang der Indizierung bei Google. "Wir führen hier ein Experiment durch, das entweder erbärmlich scheitern, oder über unsere wildesten Träume hinaus ein Erfolg werden wird." schreibt
Herzlich aus Hürth
Nicola Straub
Nachtrag, 16.06.2005: Intern.de bezweifelt den Nutzen von SitemapsPal, da das Programm Webseiten letztlich nicht anders spidere als die Google Robots selbst. Tara Calishain hingegen schreibt bei Researchbuzz, dass das Skript bei ihr funktioniere – allerdings nur mit dem Modus ‚referrer logging‘ auf ‚on‘; ansonsten gäbe es nur Fehlermeldungen…