Sonstiges

Anti-Digg Maßnahmen: Wie Webseite retten?

was passiert eigentlich, wenn man auf Digg.com zur Topnachricht avanciert? Nix, da der Server die Grätsche macht. Und das passiert umso schneller, je mehr er belastet wird. Gerade bei dynamisch generierten Weblogseiten wie WordPress ist das Limit bei ca. 10 konkurrierenden Zugriffen/sec. schnell erreicht. 10 Visits die Sekunde sind bei Digg.com durchaus realistisch = 600 Anfragen/Min, 36.000 Anfragen/h bzw. bei normal konfigurierten WordPress Blogs sind das ca. 18.000 SQL Queries/Min bzw. ca. 1 Mio Queries in der Stunde, wenn jede Anfrage einen Seitenaufruf bedeutet. Man kann es mittlerweile regelmäßig beobachten, daß Digg mittlerweile so gut wie jede Webseite in die Knie zwingt. Digg ist förmlich zu einer DoS-Webseite avanciert.

Was tun?
1. Ein Notfall-Template bereithalten, das nur diesen 1 Artikel (natürlich den, auf den der Digg-Link verweist) enthält. In der Einzelansicht und auf der Startseite. Sobald Digg-Effekt eintritt, entsprechend umschalten. Und nicht vergessen: Den richtigen Artikel anzeigen, nicht unbedingt den neuesten Artikel.
2. Alle dynamischen Elemente (WP Funktionen) im Template ausschalten, lieber „statisch“ arbeiten (zB Abfrage der Artikelüberschrift, des Bloglabels, etc…). Damit meine ich die Kategorie- und Monatslinks. Dann die Kommentare sogar. Alles, wie gesagt, was dynamisch generiert wird. Optional eine Umleitung auf eine statische HTML-Datei einbauen. Diese Arbeit übernimmt btw auch WP Cache. Man kann damit einer Vollsperre des Providers vorbeugen, bei Erreichen des Trafficlimits bzw. zu starker Last auf einem Shared Host.
3. Alle Plugins soweit es irgendwie nur geht deaktivieren, da diese eine zusätzliche Last erzeugen.
4. So gut wie keine Images mehr im Template verwenden
5. Warndreieck rausholen: Darauf hinweisen, daß man das Template aus Performancegründen temporär ausgewechselt hat. Somit muss sich der User über das Ekel-Design nicht wundern. Und man erhöht uU auch die Wiederkehrerquote (wenn der Trubel vorbei ist und man etwas Glück hat, ist das Besucherniveau dauerhaft um 10-20% höher).
6. Videos/Bilder fremdhosten: Handelt es sich um eine auf dem eigenen Werbserver gehostete Videodatei handelt, so schnell wie nur möglich das Video auf Google Video hochladen und im Blog embedden. Google Video arbeitet bei hoher Last besser als YouTube.com. Ebenso bei einem Bild: Auf Flickr.com laden und im Blogartikel integrieren. Traffic wird dann von Flickr bzw. Google Video „gesponsort“ 🙂 Damit verhindert man zusätzliche Traffickosten, die durchaus sehr hoch werden könnten.

Weitere Maßnahmen?

Über den Autor

Robert Basic

Robert Basic ist Namensgeber und Gründer von BASIC thinking und hat die Seite 2009 abgegeben. Von 2004 bis 2009 hat er über 12.000 Artikel hier veröffentlicht.

35 Kommentare

  • Ich würde die Sache aussitzen. Sorry, aber ich schreibe nicht für digg und eine intressante Story kann man auch ein paar Tage später lesen.

  • sehr schön. ich frage mich nur, ob man noch die chance hat etwas zu tun? denn der traffic setzt doch eher überfallartig ein. ein besuchertsunami sozusagen. gemütlich in wordpress einloggen, um plugins zu deaktivieren, klappt da bestimmt nicht mehr 😉

  • Man sollte alles versuchen, seine DB-Abfragen zu minimieren. Mir ist gerade mal aufgefallen, dass mein blog so 28-35 DB-Abfragen pro Seite macht. Wenn man so etwas wie recent-posts und dergleichen nur 1mal pro Stunde ausliest und dann cached, dann sollte damit schon eine Menge gewonnen sein.

    Sollte der Fall der Fälle kommen, sollte man die entsprechende Seite voll-statisch ablegen.

    Wenn mir mal so etwas passieren sollte, werde ich einen Erfahrungsbericht senden 😉

    Hat schon jemand Erfahrungen gemacht?

  • Leider nicht *lol* Aber es würde mich nicht stören… Braucht ja nicht gleich eine Top-Nachricht zu sein ^^

    Aber dennoch danke für die Tipps/Ideen. Besonders das mit dem Bilder fremdhosten ist sinnvoll, wie sich besonders bei allen Google-betreffenden Sachen gezeigt hat. „Neues Google Logo“ „Neues Google Design“ „Google CL2“ Allesamt innerhalb weniger Stunden komplett platt, da die Bilder zu oft angeguckt wurden.

  • […] Da Digg immer mehr Webseiten in die Knie zwingt (zum Beispiel Googles neues Logo) hat Robert ein paar Ideen gesammelt wie man seine Seite gegen eine solche “Attacke” schützen kann. Darunter zum Beispiel ein einfach gestricktes Template ohne grafischen Schnick Schnack oder die Verwendung des WP Cache Plugins für WordPress. […]

  • Hmmm … wenn man die eigene Arbeitszeit hoch genug einschätzt, sollte der Umzug des Blogs auf einen geeigneten Web server drin sein. WordPress ist zwar mit Datenbankzugriffen recht verschwenderisch, aber trotzdem ist es möglich, digging und slashdotting ohne spürbar längere Antwortzeiten zu überstehen. Für den Abrechnungswert einer Stunde Arbeitszeit kann man einen entsprechenden Web server einen Monat lang betreiben – und den Besucheransturm vom ersten Moment an sorglos geniessen 😉

  • Robert, ich dachte daran den Blog von Anfang an auf einem geeigneten server zu hosten. Agieren statt reagieren …
    „Was tun in dem Moment?“ Entweder eine schlechte Entscheidung aussitzen, oder den hosting service anrufen. Wenn der gut ist, kann der Umzug von einem virtuellen auf einen dezidierten server sehr schnell, d.h. mit minimaler Auszeit, erledigt sein.

  • 1&1 bietet da momentan etwas an, für den Notfall, aber selbst das dauert dort einen Tag! Das Grundproblem ist, daß sich die meisten Blogger keine großen Gedanken um Digg-Effekte machen müssen, was den Webhoster angeht. Klar, wer einen Blog aufmacht und hofft, gediggt zu werden, ist entweder sehr „ehrgeizig“ oder etwas übermotiviert. Da das eben keine Grundüberlegungen sind, wenn man sich einen Hoster sucht, steht man unweigerlich vor einem knackigen Problem, wenn es doch mal passiert (Spon, Heise, Digg, Slashdot,…). Daher der obige Artikel, wenn das Kind in den Brunnen gefallen ist. Soll sich jetzt nicht negativ anhören, was den Digg-Effekt angeht oder gar „warum sind Blogger so doof“. Es ist einfach zu unwahrscheinlich, daß so ein Fall auftritt und wenn doch, sollte man zumindestens als WordPress-User eine Idee haben, was man tun kann, bevor die Seite dead ist :-))

    Sprich: Lange Rede kurzer Sinn = Nicht gleich einen Rootserver schnappen, aber Notfallplan parat halten

  • Mein Kommentar sollte den Artikel ganz bestimmt nicht negativ adressieren oder abwerten. Ich spreche aus der Erfahrung jahrelanger Arbeit mit eigenen Seiten und als Berater. Wenn man sich mit Massenhostern einlässt, bekommt man was man kauft, und Flexibilität gehört mit Sicherheit nicht zum Paket. Für ein paar Dollar mehr bieten kleinere Web hosts (damit meine ich keine Klitschen oder reseller) skalierbare Lösungen, incl. qualifiziertem 24/7/365 support und der Fähigkeit zu sofortigen Umzügen an. Es gibt sogar hosts, deren shared servers spikes wie slashdotting locker wegstecken.

  • Einen kann ich guten Gewissens empfehlen, das ist der einzige mir bekannte host bei dem es bisher keinerlei Querelen bzgl. der Abrechnung gab, aber top notch service und vernünftige Preise, eigene IP Adressen für jede domain… Ich bin dort seit vielen Jahren ein sehr zufriedener Kunde. Bei allen anderen mir bekannten Firmen hatte ich oder meine Mandanten irgendwann schwerwiegende Probleme. Mit hosts in Deutschland habe ich noch nicht viel gearbeitet, aber was ich da bisher gesehen habe, war nicht gerade überragend. US-hosting hat aber keine wirklichen Nachteile.
    Eine gute Methode um hosting reviews zu finden, ist eine Suche nach [„insert-hosting-service sucks“] bei Google.com (Web *und* Group search).
    Gute Vorauswahlen bieten sites wie Web Hosting Reviews. In Ergänzung zu den üblichen checklists: dezidierte IP Adressen auch auf shared servers ist ein Muss, und ich würde mir vorab bestätigen lassen, dass dezidierte server in Bereitschaft gehalten werden, um on the fly aufrüsten zu können. M.E. ist der Preis das unwichtigste Auswahlkriterium, jedenfalls für kommerzielle sites.
    HTH

  • Wo bekommen WordPress Weblogs dicke Backen?

    Wie verhält sich ein Weblog bei heftigem Traffic? Wie groß werden WordPress-Datenbanken? Welche Engpässe machen sich bei regen Besucherströmen bemerkbar? Fragen über Fragen, und nur wenige Antworten. Während über da…

  • Favoriten & Links zu WordPress / Plugins

    Passend zu den WordPress-Links am heutigen Tage zwei kleine Ergänzungen zu WordPress-Links und WordPress-Plugins. Einmal mehr Aufmerksamkeit wird mir keiner überlnehmen, oder? WordPress Plugin Links auf einer Seite sind immer hilfreich. K&uum…

  • Wenn man vom Teufel spricht… Der Grup-Tekkan-Hype hat meinen Server am Donnerstag tatsächlich ganz schön in Bedrängnis gebracht – während die Jungs bei TV Total waren, hatte ich in der Werbepause und wieder nach der Sendung Server-Loads von 148! MySQL hat sich leider recht fix verabschiedet, aber der Apache hat tapfer durchgehalten und dank WP-Cache waren wenigstens die wichtigen Artikel erreichbar. Wenn auch brutal langsam. Notfall-Templates lagen natürlich noch nicht bereit und mitten im Sturm noch was zurecht basteln? No way.

  • […] Natürlich ist Traffic nicht gleich Traffic. Blogtraffic kommt wohl hauptsächlich von Suchmaschinen, RSS-Lesern und den sogenannten Rerferrern (Links von anderen Seiten/Blogs). Und dabei steuert jeder Teil der Leserschaft unterschiedliche Anteile zu den AdSenseeinnahmen bei. Ein Blog lebt quasi von den RSS-Lesern, also den Stammlesern. Sie sind es, die sich an Diskussionen beteiligen und den Blog letztlich zu dem machen, was er ist. Sie steuern ihren Teil dazu bei, dass der Blog “funktioniert”. Auf der anderen Seite kommt bei ihnen wohl die oft beschriebene “Bannerblindheit” am stärksten zum Tragen. Ganz zu Schweigen von den Lesern, die den Blog nur über RSS verfolgen. Wenig allgemeines lässt sich über den Traffic sagen, der von den Referrern kommt. Aktuelle Beispiele zeigen, dass der Traffic teilweise überwältigend sein kann. Dass das nicht nur positiv ist und wie man dem Ansturm entgegenwirken kann hat Robert jüngst mal zusammengefasst. Referrertraffic ist von Haus aus eher nicht optimal für AdSenseklicks. Wenn man sich allerdings etwas Mühe gibt, kann man zumindest aus einem Teil dieses Traffics neue Stammleser gewinnen. Und um die lohnt es sich bekanntlich besonders zu werben. Quasi das komplette Gegenteil zu den Stammlesern sind die Besucher, die über ein in eine Suchmaschine eingetipptes Stichwort zu einem Blog finden. Ich brauch da nur von mir selbst ausgehen, um mir das Potential eines solchen Lesers auszumalen. Gebe ich einen Suchbegriff ein und gelange dadurch auf eine Seite suche ich ziemlich schnell nach der Information, die ich suche. Finde ich sie bleibe ich durchaus ein paar Augenblicke und schaue mich um. Finde ich sie allerdings nicht, geh ich zurück zu den Suchergebnissen und schau mich anderswo um, ob ich finde, was ich suche. Auf meiner persönlichen Suche erwisch ich mich, aber ab und zu dabei, wie ich auf gut designte Ads klicke und dabei erst danach merke, dass es wirklich AdSense oder ähnliches war. Und genau da liegt das große Potential, aber dazu in einem späteren Beitrag mehr. […]

  • Das ist genau der Grund, warum ich noch immer keinen Blog habe und wahrscheinlich auch nie einen haben werden: Billig-Server und 5-Minuten-Schnellstart-Wordpress würde mich nicht ruhig schlafen lassen.

    Wenn eine Seite kurz geslashdottet ist (spricht sooo lahm, dass selbst der treueste Leser bzw. sein Timeout aufgibt), was soll’s? Kommt vor. Bei nem Hobby akzeptabel. Da der Digg-Effekt schnell wieder abnimmt, würde ich nicht im Traum dran denken, nachdem er eingetreten ist noch irgendetwas umzuziehen. (wenn der provider den virtual server schnell upgraded ist natürlich ein toller service) aber digg ist eh krank.

    Zugegen mir wäre das auch peinlich, wenn mein hypothetisches Blog in die Knie geht. Dagegen helfen nicht umbedingt nur überdimensionierte Server. (Ein Blog braucht keine dezidierte Maschine, damit die den ganzen Tag vor sich hin-idle-t bis abends endlich der einzige Leser vorbeikommt.) Aber ein Server für dynamischen Content braucht zumindest so viel RAM, dass die Datenbank nicht abkackt, auch nicht während des Digg-Effekts.

    Caches haben auch noch keinem geschadet. (Auch Proxys auf Client-Seite, caching freundliche http header, caching freundliche browser, aber das ist ein andere geschichte.) Genausowenig wie schlanke Seiten ohne unnötige Grafiken.

    Lange Rede, kurzer Sinn (falls sie überhaupt Sinn enthält):
    Der Digg-Effekt beweist nur, dass es von vorneherein nicht die gloreichste Idee war auf dynamischen Content zu setzen. Manche Anwendungen (z.B. riesige Datenbanken, die sich noch dazu ständig ändern) lassen sich nicht sinnvollerweise statisch umsetzen („cron: wget -r /“ naja) und theoretisch skalieren Datenbanken besser als das Dateisystem, aber in der Praxis ist so ein Blog-Artikel halt statisch. Von den Kommentaren abgesehen wird er sich im Normalfall nicht ändern. Falls sich doch irgendetwas in der Randspalte ändert, interessiert das den Leser eh nicht. Apache ist verdammt gut darin, statische Seite auszuliefern, auch unter Digg-Bedingung, auch (und gerade) auf einem shared host; auch auf einem zum server umgewidmeten uralt pc. (Das hatte damals ein guten Grund als Gutemberg das statische Publizieren erfunden hat. Die dynamische Lösung war nicht so erfolgreich.) Bevor ihr viel Zeit in Notlösungen investiert: Macht’s doch einfach statisch.

    Leider habe ich nur eine Software gefunden, die einen Blog (optional) komplett statisch rendert, und die wird ein WP-Fan nicht überzeugen: Blosxom (Perl oder Python oder Ruby oder PHP)

  • Meine Blogseiten sind alle statisches HTML. Da muß sich ja nur was ändern, wenn jemand einen neuen Kommentar schreibt oder ich was neues poste. Dann wird bei mir aus der MySQL via PHP neues total statisches HTML erzeugt. Dann klappt’s auch mit dem Digg, und dem Slashdot usw. Das wäre meine Empfehlung…

  • […] Für den Seitenbetreiber kann ein Eintrag bei Digg auch nach hinten losgehen. Zumindest wenn er zur Topnachricht avanciert. Basic Thinking bietet für dieses Szenario eine Anleitung, wie der Server den Ansturm überstehen kann. […]

  • […] Wenn man davon ausgeht, dass man bei Digg 51 Diggs benötigt um innerhalb von 24 Stunden auf die Startseite zu kommen, wäre das für einen Submitter eine Investition von $71. Klar, rein theoretisch können es auch $100, $200, etc sein, die der Submitter zahlen muss um auf die Startseite zu kommen. (Der Submitter kann übrigens die maximale Anzahl der Diggs angeben, die er für einen Beitrag haben will). Laut Robert von Basic Thinking erhält man über so einen Startseiten Link gut und gern 10 Visits pro Sekunde. Wieviele Visits das dann an einem Tag sind, kann man sich ja leicht ausrechnen. Auch wenn es, wie in dem Artikel “Spam Digg For Only $20″, “nur” 10.000 Besuche am Tag sind, sieht man, dass es sich durchaus um ein sehr gutes Geschäft für den Submittter handelt. […]

  • Gibt es denn keine Tools oder WordPressplugins, die eine statisches Abbild der Blog-Seiten machen ?

    Ich habe zwar keinen aktuelle Erwartungen, auf der Digg-Startseite zu landen, aber auch so ist mein Server manchmal schon am Limit, was die gleichzeitig vom Provider erlaubten Prozesse angeht.

  • doch, schon, nennt sich WP Cache, scheint aber nicht mit dem neuesten WP 2.04 zu funktionieren. Habe aber schon etwas länger nicht mehr geschaut, ob die das Plugin upgedatet haben

  • […] Ich bin noch nie gediggt worden – zum Glück. Allerdings schon einmal geyiggt. Wenn wir zu Robert und dem SEO Black Hat [2. Punkt] hinüberschauen, dann sind wohl Artikel über Yigg erfolgreich bei Yigg und Artikel über Digg erfolgreich bei Digg. […]