Dem Google die Feeds verbieten

Immer öfter stolpere ich in den Google Results über Ergebnisse die direkt auf einen Feed zeigen. Das passiert lustigerweise primär (zumindest subjektiv) bei Wordress-Blogs. Dabei lässt sich da eigentlich recht einfach Abhilfe schaffen. Via Robots.txt lassen sich (zumindest die braven SE-Bots) von den Feeds fernhalten:


User-agent: *
Disallow: /*feed/*
User-agent: googlebot
Disallow: /*feed/*

Das gilt so für alle Feeds die über feed/in der URL erreichbar sind. In meinem Blog trifft das auf alle Feeds (inkl. Artikelbezogene Kommentarfeeds zu). Ich wusste bisher auch nicht, dass Wildcards in dieser Form in der robots.txt erlaubt sind. Der Google-Checker (Webmaster Tools) hat jedoch sein okay dazu gegeben, also nehm ich das mal so hin und werde es ab sofort so einsetzen.

Wer will, darf’s natürlich gerne mitnehmen ;)
Für die bösen Roboter gibt’s übrigens SpiderTrap. Das kommt hier gleich aus der Nachbarschaft und wirkt bei mir seit Monaten recht gut gegen BlutContentsauger. Unbedingt mal ausprobieren.

Ähnliche Beiträge

  • Wohnungsanlage nach KfW40 mit Blockheizkraftwerk

    Wie bereits gestern erwähnt, haben wir seit 2 Tagen einen Mietvertrag für eine neue Wohnung, in die wir wohl Anfang Dezember einziehen werden. Da die wichtigen Personen auf dem Bau ab Montag erstmal 3 Wochen Urlaub machen, waren wir gestern noch einmal kurz vor Ort um zu klären wann die Deadline für verschiedene Anpassungen/Änderungen (Zusätzliche…

  • RSS-Feeds: Von 320 auf 170

    Weil der Nico damit den Nagel auf den Kopf trifft und ein Thema anschneidet, dass mich schon seit Wochen nervt und wurmt, habe ich nun auch gehandelt. Die Anzahl der Feeds in meinem Feedreader ist binnen weniger Minuten von 320 auf 170 geschrumpft. Das klingt immer noch viel, ist es aber gar nicht so sehr….

  • Google-Mini-Analyse

    Ich habe gerade mal wieder etwas intensiver durch meine Statistiken geguckt. Bei den Statistiken für dieses Blog fiel mir dabei auf, dass in den „Top search terms“ der letzten 7 Tage (via 103bees.com) „Folkert Knieper“ auf Platz 5 hinter den üblichen Verdächtigen (youporn, myvideo,…) gelandet ist. Wow – ich hätte nicht gedacht, dass immer noch…

  • Gravatar: Alter Hut

    Man man man. Nun ist Gravatar.com nach Monaten wieder online (derzeit beta unter http://site.gravatar.com) und es ist einfach nur Mist. Es ist langsam, reagiert teilweise gar nicht und ist so nützlich wie der UselessAccount. Ich kann meinen Gravatar nicht austauschen, keine zweiten hochladen und für das anlegen einer zweiten eMail brauch ich einen pro-Account für…

8 Kommentare

  1. Das dürfte aber auch die (wenigen) Feedreader treffen die sich an die robots.txt halten. Aber das dürften eh so in etwa 0 sein ;-)

  2. Ja. Ich hab das mit den Feeds bei mir im Blog schon etwas länger. Soweit funktioniert das auch ganz gut.
    Nun wollte ich vor kurzem mal die Bilder (die eh nicht mehr vorhanden sind) aus dem Index entfernen. Und da meinte Google das Wildcards in der robots.txt nicht erlaubt seien.

    Ich finde es auch sehr merkwürdig, da Google auf seinen eigenen Seiten behauptet mit Wildcards könnte man verschiedenen Bild-Typen von der Indexierung ausschließen (z.B. mit /*.gif)

  3. Pingback: Blog » WordPress Plugin: NoIndex Feed » Frank Helmschrott

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert