Aktuelle Perfomanceprobleme

Seit einigen Wochen ächzt die Wikipedia mal wieder spürbar. Auch 39 Server ändern nichts daran. Kate Turner meint, dass keine der bisher von Außenstehenden angestellten Vermutungen über die Ursache zutrifft:

Die Ursache sei kein Plattenplatzproblem (dieses Gerücht hat seine Ursache wohl in der kürzlich begonnenen Komprimierung alter Artikelversionen), auch die Anzahl der Server sei es diesmal ausnahmsweise nicht und schon gar nicht die Außenanbindung des Clusters. Selbst der mysteriöse Bot, der über Tage mehr als 100 Request/Sekunde auf die Wikipedia losjagte sei unschuldig (schließlich sei sein Treiben mittlerweile unterbunden worden). Nein, es liege vielmehr an dem mangelhaften Loadbalancing:

What is making the site slow is mainly configuration and software issues. The primitive load balancing in use doesn’t make good use of the hardware – some apaches are at 100% CPU while others are nearly idle; the 512MB apaches start swapping, while the 1GB ones are fine, but reducing the number of connections means that the 1GB ones run at half capacity. A proper solution to distribute requests based on load is needed. Yes, it’s annoying. Sorry. It’s being worked on. If anyone wants to help, please do.

Wer also Ahnung von sowas hat, schaue einfach mal im IRC (#mediawiki) vorbei.


Kommentare

2 Antworten zu „Aktuelle Perfomanceprobleme“

  1. Avatar von JeLuF
    JeLuF

    Hallo,

    seit gestern Abend ist ein Load Balancer im Einsatz (PEN), ein anderer (PerlBal) wird gerade evaluiert.

    Erste Erfahrungen: Die Last wird sehr gleichmaessig verteilt, ueber Limits lässt sich einstellen, wie viele Verbindungen ein Server maximal verkraftet. So laesst sich eine Ueberlastung der Server verhindern. Leider hatte letzteres zur Folge, dass die Benutzer eine Fehlermeldung erhalten, wenn alle Verbindungen in Gebrauch sind.

    Da als Load Balancer zwei Apaches umgebaut wurden, scheint nun die Serverleistung zum Engpass zu werden.

    Die Squids vor den Apaches sind gerade so ausreichend. Im Moment sind es 4, Anfang der Woche waren es kurzfristig nur 3 – mit massiven Performanceauswirkungen. Ein Apache wurde zum Squid umgebaut, sodass anonyme Benutzer gecachete Seiten innerhalb von 2-3 Sekunden geliefert werden.

    Damit fehlen im Moment 3 Apaches. 5 weitere sind defekt.

    Im Moment arbeiten wir an der Effizienzsteigerung der Squids in Paris, Verlagerung der Load Balancer auf andere Rechner, um 2 Apaches wieder frei zu bekommen, evaluieren eine vermutlich leistungsfähigere Load Balancer Software, kämpfen mit Apaches, die ohne offensichtlichen Grund urplötzlich alle gleichzeitig furchtbar langsam werden, setzen eine Überwachung auf, um Probleme schneller zu bemerken und die Ursachen der Probleme schneller zu erkennen. Viel zu tun. Experten sind gerne willkommen.

  2. Wikipedia performance problems
    Since I seem to be using the Wikipedia quite much, I have become the „Wikipedia guy“ among friends. People ask me quite often these days why it’s so slow; Finally the mailing list wikide-l had answers:

    No space problems – They are using history …

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.