Performance: 1.2 Trillion Google Searches
1.2 trillion searches: So viele Suchanfragen hat Google für Zeitgeist 2012 ausgewertet. Statistiken anderer Unternehmen bestätigen, dass die Gesamtzahl aller von Google in 2012 beantworteten Suchanfragen tatsächlich in dieser Größenordnung liegt.
Das klingt beeindruckend – auch dann noch, wenn man sich klar macht, dass das amerikanische trillion
gemeint ist, und es auf deutsch nur 1200 Milliarden Suchanfragen sind. Also ungefähr 3,3 Milliarden Suchanfragen pro Tag – weltweit wohlgemerkt.
Stellt sich die Frage: Wie viele Rechner braucht man wohl, um 3,3 Milliarden HTTP-Anfragen pro Tag zu verarbeiten – mal unabhängig von der internen Verarbeitungslogik?
Ein Commodity-Rechner beantwortet mit Standardsoftware ungefähr 500.000 Anfragen pro Sekunde. Das entspricht 30 Millionen Anfragen pro Minute, 1,8 Milliarden pro Stunde oder 43,2 Milliarden pro Tag.
Überraschend? Das sind immerhin zehnmal mehr als Google Suchanfragen beantwortet. Dabei würden viele Entwickler vermutlich intuitiv annehmen, dass die Google-Suche einer der meist genutzten Dienste im Internet ist, und eine ganze Farm von Rechnern benötigt wird, um den Traffic zu verarbeiten?
Da ist schon etwas dran. In meiner vereinfachten Rechnung habe ich nämlich eine Reihe wichtiger Punkte unterschlagen:
- Der Traffic verteilt sich nicht gleichmäßig über den Tag.
- Es werden zahlreiche HTTP-Requests pro Suchanfrage ausgeführt – beispielsweise aufgrund der Auto-Vervollständigung des Suchtextes, der Anreicherung der Ergebnisliste um Bilder sowie der Vorschaufunktion für die Ergebnisse.
- Die Google-Suche liefert nicht nur statische Inhalte aus. Das System greift auf eine gigantische Datenbasis zu, um die besten Ergebnisse zu finden.
- Pro Suchanfrage werden zahlreiche Informationen zu den Suchergebnissen gespeichert, um auf Basis des Nutzerverhaltens die Suche kontinuierlich zu verbessern.
Dennoch: Wenn man nur die Anzahl der HTTP-Requests betrachtet, so ist die Google-Suche aus einer Performance-Betrachtung heraus uninteressant. Andere Services leisten deutlich mehr. Häufig sind es gerade solche Services, an die man nicht zuerst denkt. Intuition ist eben nicht alles.