Blogspam-Experiment: Reset und Spamschutz

So, nun ist passiert was irgendwann kommen musste. Das Blogspam-Projekt (blogspam.de) hat die Grenzen des Shared-Hosters gesprengt und Dreamhost hat die Seite gesperrt. Um größere Probleme zu vermeiden, habe ich nach reaktivierung die Kommentardatenbank (knapp 150.000 Kommentare) geleert und Akismet aktiviert.

Diese Mail erreichte mich dazu von Dreamhost:

I have disabled your site blogspam.de for causing severe problems with
the squirt server, plus your wordpress database has 147,280 spam
comments. The apache status page showed a flood of POST requests, most
to the URL:

/2007-04/spam-comment-spam-und-trackback-spam/

Ich muss dazu sagen, dass ich die Sperre absolut nachvollziehen kann. Die Zeit die einzelne Seiten teilweise zum laden gebraucht haben, hat erahnen lassen, was die Datenbank für eine Aktion fährt, wenn gerade ein Beitrag mit 5.000 oder mehr Kommentaren aufgerufen wird.

Leider habe ich in der Vergangenheit nie wirklich die Zeit und den Elan dafür gehabt die ganze Aktion mal etwas genauer zu analysieren. Festhalten lässt sich jedoch die Tatsache, dass der größte Teil der Spamkommentare durch einen kleinen Teil der Beiträge entsteht. Es gibt offenbar einige wenige Beiträge die die besondere Aufmerksamkeit der Spammer erregen. Das wiederum lässt den Rückschluss zu, dass die meisten, großen Spammer ein Blog / eine Website nicht komplett spidern, sondern nur den Beitrag bespammen, den sie gezielt über Suchmaschinen zu einem bestimmten Keyword finde.

Ich werde das Projekt aber dennoch weiterlaufen lassen. Im nächsten Schritt interessiert mich nun wie sich das Verhalten der Spammer bei entsprechend wasserdichtem Spamschutz verändert und ob die Frequen an täglichem Spam eher steigt oder eher sinkt. Ich werde das ganze vorerst mal auf Akismet als Spamschutz konzentrieren und sehen wieviel dann noch durchrutscht.

Ähnliche Beiträge

  • Gefährlich: Adsense-Eigenklicks

    In der Vergangenheit hat man immer wieder gehört, dass Adsense-Accounts bei Google wegen sog. Eigenklicks gesperrt wurden. Diesbgzl. ist Google sehr empfindlich. Für den gemeinen Blogger und Webworker von nebenan ist das Risiko beim rumbasteln sehr groß. Ich fühl mich selber oft dazu verleitet auf die Anzeigen zu klicken. NIcht wegen der 10 cent sondern…

  • Aufräumnotizen

    Ich räume auf. Erstmal ja nichts allzu spektakuläres. Kommt sogar öfter mal vor bei mir. Zur Zeit herrscht hier zwar Chaos, im Normalfall herrscht hier aber halbwegs Ordnung. Abgesehen davon, dass ich aufgrund meines Hobbys (Flugmodellbau) an chronischer Platznot leide führte Aufräumen in der Vergangenheit meist mittelfristig zum Erfolg. Das funktioniert dann in der Regel…

  • Google: Leiser Start von Searchmash

    Ohne großes Tamtam hat Google SearchMash gestartet. SearchMash sieht ein bisschen aus wie ein Web 2.0-Google. Wenn auch ohne dass dabei ein Feature nach erzwungenem Web 2.0 aussieht. Eigentlich ist SearchMash erstmal nicht so viel anders als das normale Google, ein paar kleine Unterschiede gibt’s dann aber doch: Die Google-Optik fehlt im Moment noch. Es…

5 Kommentare

  1. Haste denn noch ne Kopie von der Datenbank? Mit deinen paar Spamcomments könnte man sicherlich eine nette Statistik machen (Herkunft, meist gespammtes Key, Zieldomains,.. ) :-)

  2. Die Auswertung der Keywords würde ich wirklich gern sehen. Ich mache bei mir so etwas regelmäßig und es ergeben sich Kuriositäten, wonach die Leute so suchen. Das meiste stammt dabei tatsächlich aus Kommentaren…

  3. Pingback: Links aus der Nachbarschaft am 01. Dezember « Natividad Hersh - Blog

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert