Google hat laut eigenen Angaben endlich das lang erwartete Caffeine Update gefahren und auf die Datencenter überspielt. Eigentlich war das Update für Anfang Januar 2010 geplant, wir berichteten hier darüber.
Wie schon hier und hier angekündigt, handelt es sich dabei um eine größere Aktualisierung der kompletten Google Infrastruktur. Das Update sorgt dafür dass neue Inhalte schneller gecrawled, indexiert und damit auch schneller gefunden werden. Aufgrund der schnellen Entwicklung des Internets, sowie der schnelllebigkeit der angebotenen Informationen war ein Update hinfällig. Dienste wie Twitter, Facebook, Blogs, News-Pages, etc. erzeugen sehr viele Informationen im Sekunden Takt, diese müssen schnellstmöglich auch zu finden sein.
Mit Caffeine rückt Google vom Konzept der statischen Indexe ab, die in regelmäßigen Intervallen erneuert wurden. Die Hauptschicht wurde alle paar Wochen erneuert. Für jede Aktualisierung einer Schicht wurde das gesamte Web analysiert, was zu einer erheblichen Verzögerung zwischen dem Zeitpunkt der Veröffentlichung von Informationen im Web und dem Zeitpunkt, ab dem diese bei Google gefunden werden konnten, sorgte.
Google kann nun neue Inhalte direkt in den Index einspielen. Das Web wird jetzt nur in kleinen Teilen analysiert um den Index kontinuierlich zu aktualisieren. Caffeine erlaube es Webseiten in einer enorm großer Zahl zu indizieren. So verarbeitet das System mehrere hunderttausend Seiten pro Sekunde. Derzeit umfasst der gesamte Caffeine-Index ca. 100 Petabyte (etwa 100 Millionen GByte) an Daten, wobei täglich mehrere hundert TByte an Daten hinzukommen.
Google betont, dass sich am Ranking (vorerst) nichts ändert. Ob dies der Realität entspricht und so bleibt, ist abzuwarten.