So funktioniert Google: Die Geschichte eines Google Ranking Engineers – Berichterstattung und Analyse von SMX West 2016

Veröffentlicht: 2021-10-08

Hallo Freunde. Von Zeit zu Zeit berichten wir hier auf Linkarati über Neuigkeiten, Trends oder Präsentationen, von denen wir glauben, dass sie es wert sind, geteilt und erweitert zu werden.

Heute bin ich über einen überzeugenden Tweet von Rae Hoffman gestolpert:

Der Link führt zu SMXs Video von Paul Haahr, seit 14 Jahren Software Engineer bei Google, der auf der SMX West 2016 einen Vortrag über die Funktionsweise von Google aus seiner Sicht als Google Ranking Engineer hält.

Wie Danny Sullivan – der Paul vorstellt – sagt, spiegelt Pauls Titel nicht wider, dass er Teil der Führungsspitze des Google-Ranking-Teams ist .

Als SEO sollte dies Ihr Herz höher schlagen lassen.

Danny wiederholt, wie glücklich wir (die SEO-Community) sind, Paul anwesend zu haben. Und wie Sie ihrem Tweet entnehmen können, ist Rae fest davon überzeugt, dass dies etwas ist, das jeder SEO gründlich beobachten und sich Notizen machen muss. Wer bin ich, um zu argumentieren?

Ich habe oft festgestellt, dass mich das Schreiben von Berichten über eine Präsentation noch mehr lehrt als Notizen zu machen, da ich einen Schritt weiter gehen und Notizen schreiben muss, die andere verstehen und schätzen können. Es fügt eine weitere Ebene des kritischen Denkens hinzu.

Ich beschloss, genau das zu tun, um sowohl das Material selbst besser zu verstehen als auch Ihnen zu helfen, die Präsentation schneller zu verdauen. Win-Win, oder? Hinweis: Rae hat hier ihre eigenen Notizen und Berichterstattung.

Ich empfehle Ihnen, dem Video zu folgen, das überall eingebettet wird. Unten habe ich auch Pauls Präsentation von Slideshare eingebettet, die ich ausschneiden und Standbilder posten werde, um meine Berichterstattung zu begleiten.

So funktioniert Google: Die Perspektive eines Ranking-Ingenieurs von Paul Haahr von der Search Marketing Expo - SMX

Lehnen Sie sich zurück, genießen Sie und lassen Sie mich wissen, was Sie denken.

Lassen Sie uns darauf eingehen.

Hinweis: Emanuele Vaccari hat diesen Beitrag zusammen mit einigen seiner eigenen Gedanken ins Italienische übersetzt. Seinen übersetzten Beitrag könnt ihr hier sehen.

Was ein Google Ranking Engineer macht

Ich werde tatsächlich sofort eine meiner eigenen Regeln für die Berichterstattung brechen und die chronologische Reihenfolge ignorieren (aber nur für den Moment – ​​ich werde die Präsentation nach diesem Abschnitt chronologisch durchgehen).

Paul hatte ein Thema in seine Präsentation eingebettet, das meiner Meinung nach als Rückgrat seiner Präsentation diente. Dieses Thema lautet: "Was machen Ranking-Ingenieure?" .

Laut Paul gab es vier Versionen dieser Antwort, die jeweils die Rolle des Ranking-Ingenieurs leicht verfeinerten:

  1. Schreiben Sie Code für diese [Google-Such-]Server. Quelle: Folie 16
  2. Suchen Sie nach neuen Signalen. Kombinieren Sie alte Signale auf neue Weise. Quelle: Folie 19
  3. Optimieren Sie für unsere Metriken [Relevanz/Suchabsicht und Qualität]. Quelle: Folie 24
  4. Ergebnisse mit guten Bewertungen [von Live-Experimenten und menschlichen Bewertern] nach oben verschieben. Verschieben Sie Ergebnisse mit schlechten Bewertungen nach unten. Quelle: Folie 55

Bitte beachten Sie, dass Klammern [ ] auf meine eigenen Interjektionen hinweisen, um (unvollkommen) Pauls Folien zu verdeutlichen.

Was macht ein Google Ranking Engineer? Die wichtigste Erkenntnis, die ich erhalten habe: Stellen Sie sicher, dass sich die Suche für Benutzer (die Menschen) tatsächlich verbessert . Und wie machen sie das? Indem Sie Google besser an die Richtlinien für die Bewertung der Suchqualität anpassen .

Ein späterer Tweet von Paul an Rae betonte erneut die Bedeutung der Search Quality Rating Guidelines und dass SEOs wirklich das gesamte Dokument lesen sollten:

Mein absolutes Lieblingszitat aus Pauls Präsentation kam, als er um 16:08 Uhr über die Richtlinien zur Bewertung der Suchqualität von Google sprach. Das Zitat selbst stammt aus der 16:48-Minuten-Marke, während Folie 32 in der Präsentation. Paulus sagte:

"Wenn Sie sich fragen, warum Google etwas tut, lautet die Antwort oft, es [Suche] eher so aussehen zu lassen, wie es in den Raterrichtlinien steht."

Paul Haahr, Google Ranking-Ingenieur, SMX West 2016

Das ist eine starke Aussage. Paul fasst alle Änderungen bei Google dahingehend zusammen, dass sie versuchen, die von ihnen veröffentlichten Richtlinien zur Bewertung der Suchqualität besser zu erfüllen! Lange Rede, kurzer Sinn: Sie wollen Google verstehen? Lesen Sie deren Qualitätsrichtlinien.

Gut, springen wir in die chronologische Berichterstattung über Pauls Präsentation.

Google-Suche heute

Laut Paul gibt es heute zwei Themen in der Google-Suche:

  1. Mobile First
  2. Merkmale

Mobile ist führend bei Suchanfragen, und Google denkt immer mehr an Mobile. Dies sind keine neuen Informationen für SEOs, aber es ist etwas, was Paul betonte.

Der zweite Punkt, den Paul betonte, war die Bedeutung von Funktionen, insbesondere bei Mobilgeräten.

Google_features_slide.png

Folie vier

Interessanterweise sagte Paul heute als Zusammenfassung der Suche:

"Wir betreten immer mehr eine Welt, in der die Suche als Assistent für alle Bereiche Ihres Lebens betrachtet wird."

Paul Haahr, Google Ranking Engineer, SMX West 2016

So funktioniert die Google-Suche

Alle von Google waren früher 10 blaue Links. Paul gliederte das Problem des Rankings in der Ära der 10 blauen Links auf: "Welche Dokumente zeigen wir? In welcher Reihenfolge zeigen wir sie?"

Google_10_blue_links_ranking.png

Folie sieben

Interessant nebenbei: Paul nahm sich einen Moment Zeit, um klarzustellen, dass er das Thema Werbung nie ansprechen würde. Im Einzelnen sagte Paulus:

"Anzeigen sind großartig, sie bringen uns viel Geld ein, sie funktionieren sehr gut für Werbetreibende. Aber zu meinem Job wird uns ausdrücklich gesagt: "Denken Sie nicht an die Auswirkungen auf Anzeigen, denken Sie nicht an die Auswirkungen auf den Umsatz - Denken Sie nur daran, dem Benutzer zu helfen."

Paul Haahr, Google Ranking Engineer, SMX West 2016

Interessant zu hören über die klare Trennung von Kirche und Staat - Entschuldigung, bezahlt und organisch.

Das Leben einer Anfrage

Pauls Erklärung des Rankings beginnt mit dem Leben einer Abfrage, um zu erklären, wie die Suche funktioniert. Eine Suchmaschine besteht aus zwei Teilen:

  1. Im Voraus (vor der Anfrage)
  2. Anfragebearbeitung.

Vor der Abfrage:

  • Das Web durchsuchen
  • Analysieren Sie die Crawling-Seiten
    • Links extrahieren (die klassische Version der Suche)
    • Inhalte rendern (Javascript, CSS – Paul betonte, wie wichtig dies ist.)
    • Semantik annotieren
  • Erstellen Sie einen Index
    • Verlinken Sie den Index eines Buches
    • Für jedes Wort eine Liste der Seiten, auf denen es erscheint
    • Aufgeteilt in Millionen von Seiten
      • Diese Seiten werden "Shards" genannt.
      • Tausende von Shards für den Webindex
    • Plus Metadaten pro Dokument.

Quelle: Folie 10 und 11.

Anfragebearbeitung (wenn jemand die Suche verwendet):

  • Abfrage verstehen und erweitern
    • Benennt die Abfrage bekannte Entitäten?
    • Gibt es sinnvolle Synonyme?
    • Kontext ist wichtig
  • Abruf und Wertung
    • Senden Sie die Anfrage an alle Shards
    • Jede Scherbe:
      • Findet passende Seiten
      • Berechnet eine Punktzahl für Abfrage+Seite
      • Sendet die Top N Seiten nach Punktzahl zurück
    • Kombinieren Sie alle Top-Seiten
    • Nach Punktzahl sortieren
  • Anpassung nach dem Abruf
    • Host-Clustering (wie viele Seiten von derselben Domain stammen), Sitelinks
    • Gibt es zu viele Duplikate?
    • Spam-Herabstufungen, manuelle Aktionen gelten d

Quelle: Folie 12, 13, 14 und 15.

Google-Scoring-Signale

Paul bezieht sich auf eine einzelne Zahl, die die Übereinstimmung zwischen einer Abfrage und einer Seite darstellt.

Dies basiert auf Scoring-Signalen, die auf zwei Kategorien basieren:

  1. Scoring-Signale basierend auf einer Seite
  2. Scoring-Signale basierend auf der Abfrage.

Google_Scoring_signals.png

Folie Achtzehn

Hier zitierte Paul Version zwei der Jobs des Ranking-Ingenieurs: Suche nach neuen Signalen oder kombiniere alte Signale auf neue Weise . Paul beschrieb dies als "hart und interessant".

Schlüsselkennzahlen im Ranking: Relevanz, Qualität, Zeit bis zum Ergebnis

Paul betonte die Relevanz als Schlüsselkennzahl in den Suchergebnissen. Die Relevanz wurde im Wesentlichen als „passende Benutzerabsicht“ erklärt.

Paul bezeichnet Relevanz als „unsere Top-Line-Metrik“ und „die große interne Metrik“.

Es gibt noch zwei andere: Qualität und Zeit bis zum Ergebnis (schneller ist besser). Bei dieser Präsentation standen Relevanz und Qualität im Fokus.

Reziproke Ranggewichtung

CTR (Click-Through-Rates) werden in der SEO häufig diskutiert, insbesondere für Suchrankings. Welchen Wert hat es, das beste Ergebnis im Bereich Bio zu sein, im Vergleich zu Nummer zwei? Im Gegensatz zu Nummer vier? Dies wird oft diskutiert und debattiert. Paul erklärte den Standpunkt von Google in Bezug auf den Wert.

Er definierte die Idee als „reziproke Gewichtung“:

reciprocal_rank_weighting.png

Folie Dreiundzwanzig

Um es klar zu sagen, Paul sprach nicht über CTR. Vielmehr eine interne Metrik, die ganze Suchseiten bewertet.

Die Idee stellt eine 50%ige Wertminderung jeder Position dar, wobei die Nummer eins zehnmal mehr wert ist als die Nummer zehn.

Ziemlich faszinierend.

Und das brachte Paul zu Version Nummer drei dessen, was Google Ranking Engineers tun: Optimierung für unsere Metriken [Relevanz und Qualität].

ranking_engineers_optimize_metrics.png

Folie Vierundzwanzig

Wie bewertet Google Suchergebnisse?

Paul erklärt, dass Google die Wirksamkeit bestimmter Ergebnisse auf zwei Arten analysiert:

  1. Live-Experimente
  2. Menschliche Bewerter.

Video unten:

Live-Experimente

Google führt Live-A/B-Tests mit echtem Traffic durch und sucht dann nach Änderungen in den Klickmustern.

"Wir führen viele Experimente durch. Es kommt sehr selten vor, dass Sie bei Google suchen und nicht an mindestens einem Experiment teilnehmen."

Paul Haahr, Google Ranking Engineer, SMX West 2016

Paul nimmt sich einen Moment Zeit, um zu erklären, dass die Interpretation von Live-Experimenten eine schwierige Aufgabe ist.

Sein Hauptbeispiel (unten) ist ein Ergebnis mit einer Antwortbox. Wenn der Suchende auf die Website geklickt hat, wird dies traditionell als gutes Ergebnis angesehen. Aber was, wenn der Suchende die Antwort sah, zufrieden war und ausschloss? Traditionell würde das als schlechtes Ergebnis gewertet, aber in diesem Fall könnte es tatsächlich ein gutes Ergebnis sein.

Interpreting_live_search_experiments.png

Folie Dreißig

Der Sinn von Pauls Beispiel besteht darin, zu zeigen, wie schwierig die Analyse der Sucherzufriedenheit ist.

Human-Rater-Experimente bei Google

Die wichtigste Erkenntnis aus diesem Teil ist, dass hier wieder Mobile-First betont wird , wobei die Mehrheit der menschlichen Bewerter-Experimente auf Smartphones stattfindet .

Human-Rater-Experimente funktionieren wie folgt:

  1. Zeigen Sie experimentelle Suchergebnisse für echte Personen an
  2. Fragen Sie, wie gut die Ergebnisse sind (gleitender Wert für Relevanz und Qualität)
  3. Bewertungen aller Bewerter aggregieren

Auch hier ist es äußerst wichtig zu beachten, dass Google seine Richtlinien für die Bewertung der Suchqualität veröffentlicht hat.

Im Ernst, schau dir diesen Clip an.

Beispiele für die Bewertung der Suchqualitätsbewertung

Paul beginnt um 16:56 Uhr mit Beispielen und Screenshots von Tests zur Bewertung der Suchqualität

Ich empfehle, sich das Video für diesen Teil anzusehen, da vieles von dem, was Paul stark macht, von den Folien abhängt. Zum Nachmachen beginnt dieser Teil der Präsentation auf Folie 33.

Zwei Skalen zur Beurteilung der Ergebnisse: Relevanz und Qualität

Es gibt zwei Skalen, die Google den Bewertern zur Verfügung stellt, um die Qualität der Ergebnisse zu beurteilen:

  1. Bedürfnisse erfüllt (Relevanz)
  2. Seitenqualität

Judging_search_results.png

Folie fünfunddreißig

Mobile-First-Experimente

Paul betont auch Mobile-First.

Dies erreichen sie auf fünf Arten:

  1. Alle relevanten Anweisungen beziehen sich auf die Bedürfnisse der mobilen Benutzer.
  2. Mobile Lagen werden in Experimenten doppelt so häufig verwendet.
  3. Der Standort des Benutzers wird in die Experimente einbezogen.
  4. Das Tool zeigt eine mobile Benutzererfahrung.
  5. Bewerter besuchen Websites mit ihren Smartphones.

Ich kann nicht betonen, wie wichtig das ist. Google legt eindeutig großen Wert auf Mobilgeräte; hier gibt es keinen Mittelweg.

Bedarfsbewertung – Relevanzbewertung

Es gibt fünf verschiedene Kategorien von Relevanz, die als "Bedürfnisse erfüllt" definiert werden:

  1. Erfüllt vollständig
  2. trifft sich sehr
  3. Trifft mäßig
  4. Trifft leicht
  5. Treffen fehlgeschlagen.

Es ist wichtig zu beachten, dass Bewerter nicht nur mit fünf Optionen urteilen: Ihnen wird eine gleitende Skala angezeigt, die zwischen diesen Bewertungen liegen kann.

Ab Folie 41 geht Paul durch Beispiele für jede Bewertung:

So funktioniert Google: Die Perspektive eines Ranking-Ingenieurs von Paul Haahr von der Search Marketing Expo - SMX

Hier das begleitende Video:

Wichtige Mitbringsel:

  1. "Vollständig erfüllt" kann nur vorliegen, wenn die Abfrage eindeutig ist und ein Ergebnis vorliegt, das die Absicht des Benutzers mit der Abfrage vollständig erfüllen kann.
  2. "Hoch trifft zu" erfordert manchmal zwei spezifische, separate Ergebnisse, um die Absicht des Benutzers zu erfüllen.
  3. "Mäßig erfüllt" ist im Allgemeinen eine gute Information.
  4. "Slightly meets" ist akzeptabel, aber keine großartige Information, mit hoffentlich besseren Ergebnissen.
  5. "Fails to meet" ist lächerlich, da Paul Suchfehler zitiert, die schlechte Ergebnisse liefern.

Bewertung der Seitenqualität

Google betrachtet drei wichtige Konzepte, um die Qualität einer Seite zu beschreiben:

  1. Sachverstand
  2. Autorität
  3. Vertrauenswürdigkeit.

Die Qualitätsskala reicht von hoch bis niedrig.

Hochwertige Seiten:

  • Zufriedenstellende Menge an hochwertigen Hauptinhalten.
  • Kompetenz, Autorität und Vertrauen sind klar.
  • Die Website hat einen guten Ruf.

high_quality_pages_according_to_Google.png

Folie fünfzig

Seiten mit geringer Qualität:

  • Die Qualität der Inhalte ist gering
  • Es gibt nicht viele Hauptinhalte
  • Keine Expertise oder Autorität angezeigt
  • Die Website hat einen negativen Ruf
  • Der sekundäre Inhalt (Anzeigen) lenkt ab.

Low_quality_pages_according_to_Google.png

Folie Einundfünfzig

Optimierung der Suchqualitätsmesswerte

Einige hundert Informatiker arbeiten im Rank Engineering. Sie konzentrieren sich auf Messwerte und Signale, führen ständige Experimente durch, nehmen viele Änderungen vor – alles, um die Suchergebnisse von Google zu verbessern (und die Richtlinien für die Bewertung der Suchqualität genauer widerzuspiegeln).

Der Entwicklungsprozess ist ziemlich normal für den Softwareentwicklungsprozess.

Google_ranking_development_process.png

Folie Fifty Four

Wichtige Highlights:

  1. Der Prozess kann zwischen Wochen und Monaten dauern, um den Code zu testen.
  2. Quantitative Analysten (im Wesentlichen Statistiker) überprüfen die Daten. Sie halten die Ranking-Ingenieure ehrlich und bieten eine weitgehend unvoreingenommene Analyse der Veränderung.
  3. Ein Start-Review-Gremium überprüft eine Zusammenfassung des Projekts, überprüft Dokumentation und Berichte und diskutiert die Vorzüge der Ranking-Änderung.
  4. Das tatsächliche Pushen des Updates kann schnell oder langsam sein, je nachdem, wie bereit der Code für den Algorithmus ist.

Ranking-Ingenieure erstellen diese Updates hauptsächlich, um Ergebnisse mit guten Bewertungen nach oben und Ergebnisse mit schlechten Bewertungen nach unten zu verschieben.

Was im Entwicklungsprozess schief läuft

Paulus spricht von zwei Arten von Problemen:

  1. Systematisch schlechte Bewertungen.
  2. Metriken, die keine Konzepte erfassen, die ihnen wichtig sind.

Systematisch schlechte Bewertungen

Paul verwendet das Beispiel von [Texas Farmdünger]. Es stellte sich heraus, dass dies eine Düngemittelmarke ist, aber Google gab den Hersteller zurück. Es ist unwahrscheinlich, dass die Leute tatsächlich eine Karte zum Hersteller wollen, sondern lieber das tatsächliche Produkt sehen. Menschliche Bewerter bewerten dies jedoch durchweg als Ergebnis „sehr stark bedarfsgerecht“ .

Dies führte tatsächlich zu einem Muster, bei dem mehr Karten hinzugefügt wurden, was tatsächlich hoch bewertete Ergebnisse lieferte, aber tatsächlich schlechte Live-Sucherlebnisse.

Fehlende Messwerte

Paul zitiert das Problem, das Google in den Jahren 2008-2011 mit der Qualität hatte. Insbesondere das Problem mit Inhaltsfarmen .

Content-Farmen können minderwertige, hochrelevante Inhalte produzieren. Dies führte zu hoch bewerteten Ergebnissen, die eigentlich von geringer Qualität waren. Content-Farmen haben dazu geführt, dass Google den zweiten Schieberegler in seinen menschlichen Bewertungsexperimenten implementiert hat, um die Qualität der Ergebnisse zu beurteilen.

Es ist absolut faszinierend zu hören, wie Paul das Problem mit Inhaltsfarmen und die Auswirkungen auf die Suchqualität diskutiert und wie das Problem durch die Implementierung einer anderen Metrik zur Beurteilung der Wirksamkeit von Suchergebnissen gelöst wurde.

Faszinierend ist auch, dass Panda hier nicht erwähnt wird, wie Google algorithmisch mit Content-Farmen umgeht.

Die Lösung für fehlende Metriken besteht laut Paul darin, Bewerter-Richtlinien festzulegen oder (bei Bedarf) neue Metriken zu entwickeln.

fix_rater_guidlines_and_develop_new_metrics.png

Folie Siebenundsechzig

Und das ist die Gesamtheit von Pauls Präsentation!

Abschließende Gedanken und Takeaways

Nur ein paar letzte Gedanken zum Abschluss dieses langen Beitrags.

  1. Ich werde die Richtlinien zur Bewertung der Suchqualität eher früher als später lesen. Du solltest auch. Paul betonte, dass alle Änderungen an den Suchrankings dieses Dokument widerspiegeln sollten. Möchten Sie das Google-Ranking verstehen? (Als SEO sollte die Antwort ein klares "JA" sein!) Dann lesen Sie dieses Dokument.
  2. Google ist wirklich Mobile-First. Alle Experimente mit menschlichen Bewertern betonen in überraschendem Maße Mobile-First-Erfahrungen.
  3. Fast jede Suche beinhaltet ein Live-Experiment.
  4. Relevanz ist die wichtigste Kennzahl bei Google. Sie definieren "Relevanz" als die Erfüllung der (menschlichen) Benutzerbedürfnisse innerhalb der Suche. Wenn Sie einen höheren Rang erreichen möchten, denken Sie darüber nach, die Erwartungen und Bedürfnisse der Sucher zu erfüllen.
  5. Google legt deutlich mehr Wert auf das erste Ergebnis. Jedes nachfolgende Ergebnis verschlechtert sich um 50 % des Wertes des vorherigen Ergebnisses. Ergebnis Nr. 1 ist zehnmal wertvoller als Ergebnis Nr. 10.

Ich bin sicher, es gibt noch andere wichtige Imbissbuden, aber mein Gehirn ist offiziell gebraten. Feedback ist willkommen – ich hoffe, Ihnen hat die Berichterstattung gefallen.