Dem Google die Feeds verbieten

Immer öfter stolpere ich in den Google Results über Ergebnisse die direkt auf einen Feed zeigen. Das passiert lustigerweise primär (zumindest subjektiv) bei Wordress-Blogs. Dabei lässt sich da eigentlich recht einfach Abhilfe schaffen. Via Robots.txt lassen sich (zumindest die braven SE-Bots) von den Feeds fernhalten:


User-agent: *
Disallow: /*feed/*
User-agent: googlebot
Disallow: /*feed/*

Das gilt so für alle Feeds die über feed/in der URL erreichbar sind. In meinem Blog trifft das auf alle Feeds (inkl. Artikelbezogene Kommentarfeeds zu). Ich wusste bisher auch nicht, dass Wildcards in dieser Form in der robots.txt erlaubt sind. Der Google-Checker (Webmaster Tools) hat jedoch sein okay dazu gegeben, also nehm ich das mal so hin und werde es ab sofort so einsetzen.

Wer will, darf’s natürlich gerne mitnehmen ;)
Für die bösen Roboter gibt’s übrigens SpiderTrap. Das kommt hier gleich aus der Nachbarschaft und wirkt bei mir seit Monaten recht gut gegen BlutContentsauger. Unbedingt mal ausprobieren.

Ähnliche Beiträge

  • Webdeveloper PHP/MySQL gesucht

    Einer meiner Kunden ist derzeit auf der Suche nach 2 fest angestellten Programmiern für Webprojekte unterschiedlichster Art. PHP, MySQL und (X)HTML solltest Du im Schlaf können und mindestens so viel Spaß wie Motivation für größere Projekte mitbringen. Interesse am Einsatz und der aktiven Mitentwicklung von OpenSource-Projekten ist von Vorteil. Das Gesuch existiert derzeit in noch…

  • Kochen 4.0: Automatisch umrühren

    Ich bin nicht wirklich faul, aber wenn sich arbeiten vermeiden lassen, dann vermeide ich sie gerne. Das ist besonders dann wahr, wenn sich die Arbeiten von Geräten, Computern oder anderen technischen Hilfsmitteln erledigen lassen. Risottomaschine Rührautomat Wer gerne ab und an kocht weiss, dass ein Risotto (alternativ: Milchreis) eines der Gerichte ist, das in der…

  • Abmahnung? Es geht auch anders!

    Ich kann mich noch erinnern – es ist noch nicht all zu lange her – da wurden zahlreiche deutsche Affiliates bzgl. markenrechtlicher Dinge (z.B. Domainregistrierung mit dem Markennamen des Partnerprogramms) vom Partnerprogrammbetreiber abgemahnt. Ich meine mich auch schwach erinnern zu können, dass bei solchen Geschichten ein gelber unbunter Stromanbieter involviert war. Anyway. Es geht auch…

  • Mein privates Weblog

    Nachdem ich mich nun einige Zeit passiv bzw. nur indirekt mit Weblogs beschäftigt habe, wird’s nun endlich Zeit selber ordentlich zu bloggen. Hier ist also mein erstes, eigenes, privates, persönliches Weblog. Ohne konkreten Plan – einfach nur bloggen. Ich wünsche mir selbst schon mal viel Spaß ;)

  • Neue Google-Toolbar für Firefox

    Ehrlich gesagt habe ich die Google Toolbar seit längerem nicht mehr benutzt. Seit ich vor einigen Jahren Internetexplorer durch Firefox ausgetauscht habe standen immer alle Dienste, die mir vorher die Toolbar bot über Erweiterungen oder gar eingebaute Funktionen des Firefox zur Verfügung. Das waren primär die Anzeige des Pageranks (diverse Erweiterungen) und das Suchformular (Firefox-Standard)….

8 Kommentare

  1. Das dürfte aber auch die (wenigen) Feedreader treffen die sich an die robots.txt halten. Aber das dürften eh so in etwa 0 sein ;-)

  2. Ja. Ich hab das mit den Feeds bei mir im Blog schon etwas länger. Soweit funktioniert das auch ganz gut.
    Nun wollte ich vor kurzem mal die Bilder (die eh nicht mehr vorhanden sind) aus dem Index entfernen. Und da meinte Google das Wildcards in der robots.txt nicht erlaubt seien.

    Ich finde es auch sehr merkwürdig, da Google auf seinen eigenen Seiten behauptet mit Wildcards könnte man verschiedenen Bild-Typen von der Indexierung ausschließen (z.B. mit /*.gif)

  3. Pingback: Blog » WordPress Plugin: NoIndex Feed » Frank Helmschrott

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert