Aktualisiert man seine Website oder löscht bestehende Seiten wird der Google Index automatisch aktuell gehalten, indem die Inhalte einer Website von Zeit zu Zeit gecrawlt werden. Existiert eine Seite nicht mehr und liefert den entsprechenden HTTP-Statuscode 404 zurück, wird sie automatisch aus den Suchergebnissen gelöscht.
Ob eine Seite von Google bzw. anderen Suchmaschinen gefunden werden soll, kann der Betreiber der Website durch eine Datei namens robots.txt steuern. Hier besteht auch die Möglichkeit Ausnahmen für bestimmte Ordner zu definieren.
Wenn die robots.txt-Datei so geändert wurde, dass Suchroboter ausgeschlossen werden, wird die Website automatisch nach einiger Zeit aus den Suchergebnissen verschwinden.
Manchmal soll ein Eintrag aber möglichst schnell gelöscht werden. Google bietet zusätzlich die Möglichkeit, einzelne Webseiten oder auch ganze Domains aus den Suchergebnissen entfernen zu lassen. Diese Aufträge werden nach meinen Erfahrungen meist innerhalb von 24 Stunden bearbeitet. D.h., dass die Einträge entweder gelöscht werden, oder man einen Hinweis erhält, welche der folgenden Voraussetzungen nicht erfüllt sind.
Der Seiteninhaber muss die robots.txt-Datei so anpassen, dass seine Website nicht mehr von Google gecrawlt werden kann. Für einzelne Seiten kann auch der Meta-Tag “noindex” verwendet werden.
Existiert die Seite nicht mehr, muss der Server den HTTP-Statuscode 404 (Seite nicht gefunden) oder 410 (Gone) zurückgeben. Ansonsten wird der Antrag auf Entfernung von Google abgelehnt.
Dieser kostenlose Service findet sich in den Google Webmaster-Tools. Man benötigt nur ein Google-Konto.
Nähere Informationen hierzu findet man in der Google-Hilfe zu diesem Thema.
Noch keine Kommentare
RSS Feed für Kommentare zu diesem Artikel. TrackBack URL