Dem Google die Feeds verbieten

Immer öfter stolpere ich in den Google Results über Ergebnisse die direkt auf einen Feed zeigen. Das passiert lustigerweise primär (zumindest subjektiv) bei Wordress-Blogs. Dabei lässt sich da eigentlich recht einfach Abhilfe schaffen. Via Robots.txt lassen sich (zumindest die braven SE-Bots) von den Feeds fernhalten:


User-agent: *
Disallow: /*feed/*
User-agent: googlebot
Disallow: /*feed/*

Das gilt so für alle Feeds die über feed/in der URL erreichbar sind. In meinem Blog trifft das auf alle Feeds (inkl. Artikelbezogene Kommentarfeeds zu). Ich wusste bisher auch nicht, dass Wildcards in dieser Form in der robots.txt erlaubt sind. Der Google-Checker (Webmaster Tools) hat jedoch sein okay dazu gegeben, also nehm ich das mal so hin und werde es ab sofort so einsetzen.

Wer will, darf’s natürlich gerne mitnehmen ;)
Für die bösen Roboter gibt’s übrigens SpiderTrap. Das kommt hier gleich aus der Nachbarschaft und wirkt bei mir seit Monaten recht gut gegen BlutContentsauger. Unbedingt mal ausprobieren.

Ähnliche Beiträge

  • Bloggerstammtisch anyone?

    Ich bin neugierig. Schon einige Zeit frage ich mich warum sich neben den privaten 1:1-Kommunikationskanälen zwischen Bloggern (Skype, Telefon, ICQ,…) noch kein weiterer öffentlicher neben den Blogs selbst gefunden hat. Hier und da gibt’s bereits sowas wie Bloggerforen, die aber nur sehr spärlich genutzt werden. Daher nun ein Versuch zusammen mit Google Groups Beta über…

  • Aua Webnews aka Holtzbrinck

    Es war schon öfter unruhig um Holtzbrinck-Investitionen und die Unternehmen dahinter. Jetzt wird’s rechtlich mal wieder etwas bunter. Angeblich hat Webnews (auch hier hat Holtzbrinck bekanntermaßen investiert) nun nicht nur illegale Downloads von TV-Serien auf der eigenen Plattform geduldet sondern sogar noch explizit bei Google Adwords dafür geworben. » mehr bei dwdl.de [via BBQ]

  • Design-Update (1) und Content-Update

    Nun hab ich die Tabs in der Sidebar doch nochmal komplett umgeworfen. Gründe dafür gab’s genug. Zum einen wollten die auf den Einzelansichtsseiten der Beiträge gar nicht funktionieren, zum anderen schien’s mir logischer eine Lösung auf jQuery-Basis zu verwenden, da das Framework für einiges andere noch ganz nützlich sein wird was ich hier realisieren will.

  • Flugzeugcrash in New York

    In New York ist ein Flugzeug in ein Hochaus gecrashed. Gottlob nur eins, ein kleines und nach bisherigem Stand kein terroristischer Anschlag. Dennoch schlimm genug. Während Yahoo via AP bereits ausführlich berichtet…   bei Google News gähnende Leere…   warum? [tags]flugzeug,crash,new york, nyc, plane, crash, google, google news, news, yahoo, yahoo news[/tags]

  • Google: Neues Interface für Feedreader

    Als ich mich gerade eben zum täglichen Feedreading bei Google eingeloggt hab, bekam ich diese Zwischenseite präsentiert. Google testet ab heute ein neues Interface für den Feedreader. Um eines gleich vorweg zu nehmen – ich find’s klasse. Bisher war der Google Reader ja sehr spartanisch, was zwar okay war, aber doch auch ein paar Kleinigkeiten…

8 Kommentare

  1. Das dürfte aber auch die (wenigen) Feedreader treffen die sich an die robots.txt halten. Aber das dürften eh so in etwa 0 sein ;-)

  2. Ja. Ich hab das mit den Feeds bei mir im Blog schon etwas länger. Soweit funktioniert das auch ganz gut.
    Nun wollte ich vor kurzem mal die Bilder (die eh nicht mehr vorhanden sind) aus dem Index entfernen. Und da meinte Google das Wildcards in der robots.txt nicht erlaubt seien.

    Ich finde es auch sehr merkwürdig, da Google auf seinen eigenen Seiten behauptet mit Wildcards könnte man verschiedenen Bild-Typen von der Indexierung ausschließen (z.B. mit /*.gif)

  3. Pingback: Blog » WordPress Plugin: NoIndex Feed » Frank Helmschrott

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert