Blogspam-Experiment: Reset und Spamschutz

So, nun ist passiert was irgendwann kommen musste. Das Blogspam-Projekt (blogspam.de) hat die Grenzen des Shared-Hosters gesprengt und Dreamhost hat die Seite gesperrt. Um größere Probleme zu vermeiden, habe ich nach reaktivierung die Kommentardatenbank (knapp 150.000 Kommentare) geleert und Akismet aktiviert.

Diese Mail erreichte mich dazu von Dreamhost:

I have disabled your site blogspam.de for causing severe problems with
the squirt server, plus your wordpress database has 147,280 spam
comments. The apache status page showed a flood of POST requests, most
to the URL:

/2007-04/spam-comment-spam-und-trackback-spam/

Ich muss dazu sagen, dass ich die Sperre absolut nachvollziehen kann. Die Zeit die einzelne Seiten teilweise zum laden gebraucht haben, hat erahnen lassen, was die Datenbank für eine Aktion fährt, wenn gerade ein Beitrag mit 5.000 oder mehr Kommentaren aufgerufen wird.

Leider habe ich in der Vergangenheit nie wirklich die Zeit und den Elan dafür gehabt die ganze Aktion mal etwas genauer zu analysieren. Festhalten lässt sich jedoch die Tatsache, dass der größte Teil der Spamkommentare durch einen kleinen Teil der Beiträge entsteht. Es gibt offenbar einige wenige Beiträge die die besondere Aufmerksamkeit der Spammer erregen. Das wiederum lässt den Rückschluss zu, dass die meisten, großen Spammer ein Blog / eine Website nicht komplett spidern, sondern nur den Beitrag bespammen, den sie gezielt über Suchmaschinen zu einem bestimmten Keyword finde.

Ich werde das Projekt aber dennoch weiterlaufen lassen. Im nächsten Schritt interessiert mich nun wie sich das Verhalten der Spammer bei entsprechend wasserdichtem Spamschutz verändert und ob die Frequen an täglichem Spam eher steigt oder eher sinkt. Ich werde das ganze vorerst mal auf Akismet als Spamschutz konzentrieren und sehen wieviel dann noch durchrutscht.

Ähnliche Beiträge

  • Drobo Festplattenroboter im Praxiseinsatz

    Da das Thema NAS/externe Festplatten hier öfter gefallen ist, dürfte vielleicht den ein oder anderen auch der kleine Bericht Gerrit van Aakens über den ersten Eindruck von seinem Drobo Festplattenroboter interessieren. Der Drobo ist ein recht neues Konzept, das entweder als externe Festplatte (USB/Firewire) oder als NAS den aus mehreren (auch unterschiedlichen) Festplatten zur Verfügung…

  • Schluß mit T-Mobile – iPhone 4 ohne Vertrag

    Gleich mal eins vorne weg: Wie einige schon wissen bin ich alles andere als ein Gegner der Telekom. Im Gegenteil: Ich bin seit ca. 11 Jahren zufriedener DSL-Kunde und nochmal ungefähr 10 Jahre länger ISDN-Kunde. Zudem beziehen wir aktuell sogar das Fernsehprogramm vom rosa Riesen (T-Home Entertain). Weiterhin telefonieren wir hier seit geraumer Zeit zu…

  • 12jähriger ProBlogger

    Senior ProBlogger Darren Rowse berichtet heute über David Wilkinson, einen 12jährigen Blogger aus – woher sonst – den Staaten. David betreibt seit geraumer Zeit ein eigenes Blogger.com-Blog unter http://www.tech.co.nr/ und hat dafür sogar schon ein Netzwerk an Spielkameraden losgetreten (11- und 12jährige) die ihm dabei helfen. Auf die Frage ober Geld damit verdient antwortet er…

  • Blogdesk Debugging

    Gerade eben, kurz nach meinem letzten Beitrag hat sich Johannes, der Programmierer von Blogdesk bei mir gemeldet und mir Hilfe beid er Lösung des Problems angeboten (siehe Screenshot). Das Angebot nehme ich gerne an und blogge gleich mal mit Bild (da liegt offenbar der Hund begraben) und versuche das Problem so mit jetzt aktivierter Debug-Option…

  • WordPress 2.6.3 – dringendes Sicherheitsrelease

    Heute Nacht wurde WordPress 2.6.3 als Sicherheitsrelease veröffentlicht. Es wird dringend empfohlen alle WordPress-Installationen zu aktualisieren. Die beiden betroffenen Dateien sind: wp-includes/class-snoopy.php wp-includes/version.php Den Download gibt’s wie immer bei WordPress.org – die deutsche Version bei WordPress-Deutschland.org. Weitere Informationen zur Sicherheitslücke gibts bei Secunia.

5 Kommentare

  1. Haste denn noch ne Kopie von der Datenbank? Mit deinen paar Spamcomments könnte man sicherlich eine nette Statistik machen (Herkunft, meist gespammtes Key, Zieldomains,.. ) :-)

  2. Die Auswertung der Keywords würde ich wirklich gern sehen. Ich mache bei mir so etwas regelmäßig und es ergeben sich Kuriositäten, wonach die Leute so suchen. Das meiste stammt dabei tatsächlich aus Kommentaren…

  3. Pingback: Links aus der Nachbarschaft am 01. Dezember « Natividad Hersh - Blog

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert