Interessante Frage, die gerade heiß auf Quora diskutiert wird: Warum braucht Google mehr als drei Sekunden, um den Posteingang von GMail zu durchsuchen, aber nicht einmal eine Sekunde, um Suchergebnisse aus dem weltweiten Netz zurückzuliefern. Die Antwort, die viele von euch auf den ersten Blick ebenso überraschen dürfte wie mich: Weil Google bei der Suche auf dem GMail-Server mehr Daten durchforsten muss als bei der Websuche.
Wie bitte?
Der Google-Suchindex erfasst das öffentliche Web, zumindest sehr große Teile davon. 40 Milliarden Websites dürften aktuell im Zwischenspeicher sein, kennen dürfte Google wohl mehr als eine Billion Seiten. Der Suchriese hat mehr als 100 Millionen Gigabyte Suchdaten (100 Petabyte) gespeichert, was allerdings auch Bildsuche und Videodaten umfasst. Der Suchindex der Websuche dürfte bedeutend kleiner sein. Bei 200 Millionen GMail-Nutzern und einem Durchschnitt von 1 Gigabyte pro Nutzer wären das 200 Petabyte an Daten.
Neue Stellenangebote
Mitarbeiter*in (m/w/d) für Social Media, Öffentlichkeitsarbeit und Städtepartnerschaft (m/w/d) meinestadt.de in Sachsenheim |
||
Content Creator / Social Media / Marketing (m/w/d) Delitzscher Schokoladenfabrik GmbH in Delitzsch |
||
Content Creator / Social Media / Marketing (m/w/d) Halloren Schokoladenfabrik AG in Delitzsch |
Quora-Nutzer Adam D’Angelo schreibt dazu, und Ex-Google-Mitarbeiter widersprechen ihm nicht:
- Das Mehr an Daten bei GMail dürfte ein Mehr an Servern bedeuten, die bei einer Suche beansprucht werden.
- Das Zauberwort heißt „Caching“: Google legt für die Websuche einen Zwischenspeicher der wichtigsten Ergebnisse an, die allen Nutzern präsentiert werden. Die Suchergebnisse für GMail dagegen sind gewissermaßen personalisiert und müssen in Echtzeit verfügbar sein.
GMail-Suchergebnisse sind darüber hinaus nach Zeit sortiert, was mehr Genauigkeit erfordert. Websuch-Ergebnisse sortiert Google nach Relevanz, was Annäherungen erlaubt. Hier ist Zeit nicht der wichtigste Faktor. Wer aber seine E-Mails durchsucht, will schon, dass eine Nachricht, die vor 30 Sekunden eingetroffen ist, darin auftaucht. Verfolgt die Diskussion hier.
(Jürgen Vielmeier)