Nutzer-Click-Through-Raten und Suchergebnisse-Rankings bei Google
Veröffentlicht: 2019-03-19Betrachtet Google die Klickraten und das Nutzerverhalten der Nutzer, um das Suchranking zu beeinflussen?
Google-Sprecher haben uns mitgeteilt, dass Google die Klickraten der Benutzer beim Ranking von Seiten in Suchrankings nicht berücksichtigt – sie sind zu laut und aus anderen Gründen. Ein neues Patent von Google beschreibt, wie die Klickraten der Nutzer und andere Informationen zum Nutzerverhalten das Ranking in den Suchergebnissen beeinflussen können. Dieses neue Patent ist nicht das erste, das einen Google-Prozess vor anderen Suchmaschinen schützt, die diesen Prozess in Betracht ziehen könnten. Nach den ersten Patenten über die Interaktion von Suchern mit Suchergebnissen und wie diese Informationen zur Beeinflussung von Suchrankings verwendet werden könnten, wird es merkwürdig, dass solche Informationen weiterhin in Google Patents erscheinen, und es lädt ein, sich Dinge wie User Click- Durch Preise. Vor allem, wenn die beteiligten Ansätze detaillierter geworden sind.
Dieses Patent wurde dreimal mit Fortsetzungspatenten aktualisiert. Fortführungspatente sind Möglichkeiten, die Ansprüche aus einem Patent zu aktualisieren, um Änderungen in den Prozessen hinter einem Patent widerzuspiegeln. Das Patent sagt uns, dass Suchrankings auf der Zeit basieren können, die ein Suchender mit dem Betrachten einer Seite aus den Suchergebnissen verbringen könnte, und dass Dokumente später basierend auf längerer Betrachtungszeit höher eingestuft werden können:
Ein Aspekt des in dieser Spezifikation beschriebenen Gegenstands kann in einem computerimplementierten Verfahren verkörpert werden, das das Bestimmen eines Relevanzmaßes für ein Dokumentenergebnis im Kontext einer Suchanfrage, für die das Dokumentenergebnis zurückgegeben wird, umfasst, wobei das Bestimmen auf basiert wobei die erste Zahl eine zweite Zahl betrifft, wobei die erste Zahl längeren Ansichten des Dokumentergebnisses entspricht und die zweite Zahl zumindest kürzeren Ansichten des Dokumentergebnisses entspricht; und Ausgeben des Relevanzmaßes an eine Ranking-Engine zum Ranking von Suchergebnissen, einschließlich des Dokumentenergebnisses, für eine neue Suche entsprechend der Suchanfrage. Die erste Zahl kann eine Anzahl der längeren Ansichten des Dokumentergebnisses umfassen, die zweite Zahl kann eine Gesamtanzahl von Ansichten des Dokumentergebnisses umfassen und das Bestimmen kann das Teilen der Anzahl von längeren Ansichten durch die Gesamtanzahl von Ansichten umfassen.
Das Verfahren kann ferner das Verfolgen individueller Auswahlen des Dokumentenergebnisses im Kontext der Suchabfrage umfassen, für die das Dokumentenergebnis zurückgegeben wird; Gewichten von Dokumentansichten, die aus den Auswahlen resultieren, basierend auf Ansichtslängeninformationen, um gewichtete Ansichten des Dokumentergebnisses zu erzeugen; und Kombinieren der gewichteten Ansichten des Dokumentergebnisses, um die erste Zahl zu bestimmen. Die zweite Zahl kann eine Gesamtzahl von Ansichten des Dokumentergebnisses umfassen, das Bestimmen kann das Teilen der ersten Zahl durch die zweite Zahl umfassen, und das Relevanzmaß kann unabhängig von der Relevanz für andere als Antwort auf die Suchabfrage zurückgegebene Dokumentergebnisse sein.
Dies ist etwas komplizierter, als nur nach der Anzeigezeit für Dokumente zu suchen. Das Patent weist auch darauf hin, dass die Kategorien der Suchanfrage, für die diese Dokumente gefunden werden, auch eine Rolle bei der Auswirkung der Anzeigezeit und der Benutzer-Click-Through-Raten spielen können:
Die Gewichtung kann das Gewichten der Dokumentansichten basierend auf der Betrachtungslängeninformation in Verbindung mit einem Betrachtungslängendifferenzierer umfassen. Das Unterscheidungsmerkmal für die Betrachtungslänge kann einen Faktor umfassen, der von einer bestimmten Kategorie der Suchanfrage bestimmt wird, und die Gewichtung kann das Gewichten der Dokumentansichten basierend auf der bestimmten Kategorie der Suchanfrage beinhalten. Das Unterscheidungsmerkmal für die Betrachtungslänge kann einen Faktor umfassen, der von einem bestimmten Typ eines Benutzers bestimmt wird, der die einzelnen Auswahlen erzeugt, und die Gewichtung kann das Gewichten der Dokumentansichten basierend auf dem bestimmten Typ des Benutzers umfassen.
Die Vorteile, die uns mitgeteilt werden, können nach dem in diesem Patent für Benutzer-Click-Through-Raten beschriebenen Prozess mit sich bringen:
- Ein Rangfolge-Subsystem kann eine Rangmodifizierer-Engine umfassen, die implizites Benutzer-Feedback verwendet, um eine Neuordnung von Suchergebnissen zu bewirken, um die endgültige Rangfolge zu verbessern, die einem Benutzer eines Informationsabrufsystems präsentiert wird.
- Die Benutzerauswahl von Suchergebnissen (Klickdaten) kann verfolgt und in einen Klickanteil umgewandelt werden, der verwendet werden kann, um zukünftige Suchergebnisse neu zu ordnen.
- Daten können pro Abfrage erfasst werden, und für eine bestimmte Abfrage können Benutzerpräferenzen für Dokumentergebnisse bestimmt werden.
- Darüber hinaus kann ein Relevanzmaß (z. B. ein LC|C-Klick-Anteil) aus implizitem Benutzerfeedback bestimmt werden, wobei das Relevanzmaß unabhängig von der Relevanz für andere als Antwort auf die Suchanfrage zurückgegebene Dokumentergebnisse sein kann, und das Maß von Relevanz kann die Auswirkungen von Präsentationsverzerrungen (in den einem Benutzer angezeigten Suchergebnissen) reduzieren, die ansonsten in das implizite Feedback einfließen könnten.
Diese neueste Version dieses Patents für Benutzer-Click-Through-Raten finden Sie unter:
Das Ranking der Suchergebnisse basierend auf implizitem Benutzerfeedback ändern
Erfinder: Hyung-Jin Kim, Simon Tong, Noam M. Shazeer und Michelangelo Diligenti
Rechtsnachfolger: Google LLC
US-Patent: 10.229.166
Bewilligt: 12. März 2019
Gespeichert: 25. Oktober 2017
Abstrakt
Die vorliegende Offenbarung umfasst Systeme und Techniken, die sich auf das Ranking von Suchergebnissen einer Suchanfrage beziehen. Im Allgemeinen kann der in dieser Spezifikation beschriebene Gegenstand in einem computerimplementierten Verfahren verkörpert werden, das das Bestimmen eines Relevanzmaßes für ein Dokumentergebnis im Kontext einer Suchanfrage, für die das Dokumentergebnis zurückgegeben wird, umfasst, wobei das Bestimmen auf wobei die erste Zahl einer zweiten Zahl entspricht, wobei die erste Zahl längeren Ansichten des Dokumentergebnisses entspricht und die zweite Zahl zumindest kürzeren Ansichten des Dokumentergebnisses entspricht; und Ausgeben des Relevanzmaßes an eine Ranking-Engine zum Ranking von Suchergebnissen, einschließlich des Dokumentenergebnisses, für eine neue Suche entsprechend der Suchanfrage. Der in dieser Beschreibung beschriebene Gegenstand kann auch in verschiedenen entsprechenden Computerprogrammprodukten, Geräten und Systemen verkörpert werden.
Die Ansprüche aus diesem Patent geben uns eine Vorstellung davon, wie Google verfolgen könnte, wie Suchende mit Suchergebnissen und den Daten, die aus diesen Interaktionen stammen, interagieren. Ansprüche aus einem Patent sind das, was Staatsanwälte des USPTO prüfen, um zu entscheiden, ob ein Patent erteilt wird oder nicht. Diese Behauptungen sagen uns über ein „Ergebnisauswahlprotokoll“ und welche Art von Informationen in diesem Protokoll gespeichert und wie sie gemessen werden können. Ich habe die ersten 5 Ansprüche aus dem Patent aufgenommen, weil sie alle miteinander verwandt sind und einige Einblicke in das geben, was eine Suchmaschine untersucht, wenn wir sie durchsuchen:
Beansprucht wird:
1. System, umfassend: einen oder mehrere Computer und ein oder mehrere Speichergeräte, auf denen Anweisungen gespeichert sind, die bei Ausführung durch den einen oder die mehreren Computer betriebsfähig sind, um den einen oder die mehreren Computer zu veranlassen, Operationen auszuführen, umfassend: Beibehalten, in a Ergebnisauswahlprotokoll, Daten über die Interaktionen von Benutzern mit Suchergebnissen einer Internetsuchmaschine für mehrere Benutzer, wobei jeder Protokolleintrag im Ergebnisauswahlprotokoll für eine tatsächliche Interaktion spezifisch für eine Interaktion ist und Daten zur Identifizierung eines jeweiligen Benutzers enthält, eine Anfrage von der Benutzer, ein oder mehrere Suchergebnisse, die von der Suchmaschine als Antwort auf die Abfrage präsentiert werden, ein vom Benutzer aus den Suchergebnissen ausgewähltes Dokument, eine Ordnungsposition in einer Darstellungsreihenfolge der Suchergebnisse des vom Benutzer ausgewählten Suchergebnisses , eine Zeit, die der Benutzer mit dem Dokument verbracht hat, eine vom Benutzer verwendete Sprache und ein Land, in dem sich der Benutzer wahrscheinlich aufhält, wobei die Protokolleinträge Einträge enthalten, die identifizierenmehrere Benutzer, mehrere Dokumente, mehrere Sprachen und mehrere Länder; Bestimmen aus den Protokolleinträgen in dem Ergebnisauswahlprotokoll (i) gewichtete Klickanteile für jedes von mehreren Abfrage-Dokument-Paaren, (ii) gewichtete Klick-Anteile für jedes von mehreren Abfrage-Dokument-Sprachpaaren und (iii) gewichtete- Klick-Anteile für jedes von mehreren Abfrage-Dokument-Sprache-Land-Paaren, wobei jeder gewichtete Klick-Anteil auf einer Summe einer gewichteten Anzahl von Dokumenten basiert, die vom Benutzer ausgewählt wurden, und jede Gewichtung darauf basiert, wie viel Zeit der Benutzer damit verbracht hat das Dokument; und Modifizieren eines Informationsabrufwerts in der Internetsuchmaschine für ein spezifisches Dokument durch Anwenden eines der gewichteten Klickanteile oder einer Transformation des einen der gewichteten Klickanteile auf den Informationsabrufwert für das spezifische Dokument.
2. System nach Anspruch 1, wobei die Zeit, die der Benutzer mit dem Dokument verbracht hat, gemessen wird als die Zeit, die zwischen einem anfänglichen Durchklicken bis zum Dokumentergebnis verstrichen ist, bis der Benutzer zu den von der Suchmaschine präsentierten Suchergebnissen zurückkehrt und ein anderes auswählt Ergebnis dokumentieren.
3. System nach Anspruch 1, wobei die Protokolldaten auch für jede von mehreren Präsentationen von Suchergebnissen durch die Suchmaschine umfassen: ob ein Dokumentergebnis dem jeweiligen Benutzer präsentiert, aber nicht ausgewählt wurde, jeweilige Positionen einer oder mehrerer Auswahlen in eine Benutzerschnittstelle zur Darstellung von Suchergebnissen, Informationsabrufbewertungen ausgewählter Dokumente, Informationsabrufbewertungen aller Dokumente, die vor einem ausgewählten Dokument gezeigt werden, und Titel und Schnipsel, die einem Benutzer angezeigt werden, bevor der Benutzer ein Dokument auswählt.
4. System nach Anspruch 1, wobei die Operationen ferner umfassen: Zuweisen von niedrigeren Gewichten zu Klickfraktionen basierend auf Benutzern, die fast immer das Ergebnis mit dem höchsten Rang auswählen, niedrigere Gewichtungen als Klickfraktionen basierend auf Benutzern, die häufiger Ergebnisse niedriger in der Rangfolge zuerst auswählen in den gewichteten Klickfraktionen.
5. System nach Anspruch 1, wobei die Operationen ferner umfassen: Klassifizieren einzelner Auswahlen von Dokumentenergebnissen in zwei oder mehr Betrachtungszeitkategorien und Zuweisen von Gewichten zu den einzelnen Auswahlen basierend auf der Klassifizierung, wobei die Betrachtungszeitkategorien eine Kategorie für einen kurzen Klick enthalten und eine Kategorie für einen langen Klick.
Dieses Patent enthält auch einige Wendungen bei dem, was darin als "traditionelle Techniken für das Ranking" bezeichnet wird. Es spricht davon, dass das Ranking auf einer Kombination aus einem Information Retrieval Score und einem Authority Score unter Verwendung von PageRank basiert, aber es baut auf PageRank auf, indem es sich Links ansieht, die Seiten aus anderen relevanten Dokumenten verlinken:
Die Suchmaschine kann eine Ranking-Engine umfassen, um die Dokumente in Bezug auf die Benutzeranfrage zu ordnen. Das Ranking der Dokumente kann unter Verwendung herkömmlicher Techniken zum Bestimmen einer Information Retrieval (IR)-Punktzahl für indizierte Dokumente aufgrund einer gegebenen Abfrage durchgeführt werden. Die Relevanz eines bestimmten Dokuments, das einen bestimmten Suchbegriff oder andere bereitgestellte Informationen betrifft, kann durch jede geeignete Technik bestimmt werden. Beispielsweise kann die allgemeine Ebene von Backlinks zu einem Dokument, das Übereinstimmungen für einen Suchbegriff enthält, verwendet werden, um die Relevanz eines Dokuments abzuleiten. Insbesondere wenn ein Dokument mit vielen anderen relevanten Dokumenten (zB Dokumenten, die auch Übereinstimmungen mit den Suchbegriffen enthalten) verlinkt ist (zB Ziel eines Hyperlinks ist), kann daraus geschlossen werden, dass das Zieldokument besonders relevant ist. Diese Schlussfolgerung kann gezogen werden, weil die Autoren der Verweisdokumente vermutlich größtenteils auf andere Dokumente verweisen, die für ihr Publikum relevant sind.
Wenn die verweisenden Dokumente wiederum Ziel von Links von anderen relevanten Dokumenten sind, können sie als relevanter angesehen werden, und das erste Dokument kann als besonders relevant angesehen werden, da es das Ziel relevanter (oder sogar hoch relevanter) Dokumente ist. Eine solche Technik kann die Determinante der Relevanz eines Dokuments oder eine von mehreren Determinanten sein. Die Technik ist im GOOGLE.RTM. PageRank-System, das einen Link von einer Webseite zu einer anderen als Qualitätshinweis für die letztgenannte Seite behandelt, sodass die Seite mit den meisten solchen Qualitätsindikatoren gewinnt. Geeignete Techniken können auch verwendet werden, um Versuche zu erkennen und zu eliminieren, falsche Stimmen abzugeben, um die Relevanz einer Seite künstlich zu steigern.
Das Patent führt auch eine Rangmodifikator-Engine ein, die auch andere Möglichkeiten der Relevanzmessung untersucht.
Um solche traditionellen Dokumenten-Ranking-Techniken weiter zu verbessern, kann die Ranking-Engine ein zusätzliches Signal von einer Ranking-Modifizierer-Engine empfangen, um bei der Bestimmung einer geeigneten Rangfolge für die Dokumente zu helfen. Die Rangmodifikatormaschine stellt ein oder mehrere Relevanzmaß(e) für die Dokumente bereit, die von der Rangfolgemaschine verwendet werden können, um das dem Benutzer bereitgestellte Ranking der Suchergebnisse zu verbessern. Die Rangmodifikator-Engine kann eine oder mehrere der weiter unten beschriebenen Operationen ausführen, um das eine oder die mehreren Relevanzmaße zu erzeugen.
Die Suchmaschine kann die endgültige, geordnete Ergebnisliste innerhalb eines serverseitigen Suchergebnissignals durch das Netzwerk weiterleiten. Beim Verlassen des Netzwerks kann ein clientseitiges Suchergebnissignal vom Clientgerät empfangen werden, wo die Ergebnisse im RAM gespeichert und/oder vom Prozessor verwendet werden können, um die Ergebnisse auf einem Ausgabegerät für den Benutzer anzuzeigen.
Funktionen, nach denen eine Scoring-Engine die Ergebnisse einstufen könnte
- Inhaltsbasierte Funktionen, die eine Abfrage mit Dokumentergebnissen verknüpfen
- abfrageunabhängige Funktionen, die allgemein die Qualität der Dokumentenergebnisse anzeigen
- Eine Tracking-Komponente kann verwendet werden, um Informationen über individuelle Benutzerauswahlen der im Ranking präsentierten Ergebnisse zu erfassen. Die Tracking-Komponente kann beispielsweise ein eingebetteter JavaScript-Code sein, der in ein Webseiten-Ranking eingebunden ist, der die Benutzerauswahl (Klicks) einzelner Dokumentergebnisse identifiziert und auch erkennt, wann der Benutzer zur Ergebnisseite zurückkehrt, und so die Zeit anzeigt, die der Benutzer mit dem Betrachten verbracht hat das ausgewählte Dokumentergebnis.
Verfolgen der Nutzer-Click-Through-Raten

Die Verfolgung der Benutzer-Click-Through-Raten bedeutet, sich viele Informationen anzusehen, z. B. Protokolleinträge, die für jede Benutzerauswahl Folgendes anzeigen:
- Die Abfrage (Q)
- Das Dokument (D)
- Die Uhrzeit (T) auf dem Dokument
- Die vom Benutzer verwendete Sprache (L)
- Das Land (C), in dem sich der Benutzer wahrscheinlich befindet (z. B. basierend auf dem Server, der für den Zugriff auf das IR-System verwendet wird)
- Negative Informationen, wie die Tatsache, dass ein Dokumentergebnis einem Benutzer präsentiert, aber nicht angeklickt wurde
- Position(en) von Klick(s) in der Benutzeroberfläche
- IR-Werte der angeklickten Ergebnisse
- IR-Werte aller Ergebnisse, die vor dem Klicken angezeigt werden
- Die Titel und Snippets, die dem Benutzer vor dem Klick angezeigt werden
- Das Cookie des Benutzers
- Cookie-Ag
- IP-Adresse (Internet Protocol)
- Benutzeragent des Browsers usw.
- Ähnliche Informationen für ganze Sitzungen von Suchenden, möglicherweise werden solche Informationen für jeden Klick aufgezeichnet, der sowohl vor als auch nach einem aktuellen Klick erfolgt
Alle diese Benutzerinformationen aus den Ergebnisauswahlprotokollen können verwendet werden, um die Ergebnisse für andere Suchende später zu verbessern
Dieses Patent beschrieb auch Sucher, die es erlauben, Informationen über Klicks zu verfolgen, sogar nach dem Klick auf bestimmte Anfragen. Die oben aufgeführten Elemente können verfolgt werden, ebenso wie Besuche anderer Dokumentensätze und Suchergebnisse, einschließlich der Zeit zwischen Dokumenten. Die für bestimmte Dokumente aufgewendete Zeit kann in längere Ansichten oder kürzere Ansichten kategorisiert werden, wobei die längeren Ansichten ein allgemeiner Hinweis auf die Qualität eines Klicks durch das Suchergebnis sind.
Wofür könnten unterschiedliche Betrachtungszeiten auf einer Seite stehen?
Das Patent für Benutzer-Click-Through-Raten enthält spezifische Details dazu, was unterschiedliche Betrachtungslängen bedeuten könnten:
Beispielsweise kann ein kurzer Klick als Hinweis auf eine schlechte Seite gewertet werden und erhält daher eine geringe Gewichtung (z , 0,5 pro Klick), kann ein langer Klick als Hinweis auf eine gute Seite angesehen werden und erhält daher ein viel höheres Gewicht (z. B. 1,0 pro Klick), und der letzte Klick (bei dem der Benutzer nicht zur Hauptseite zurückkehrt) kann als wahrscheinlicher Hinweis auf eine gute Seite angesehen werden und daher ein ziemlich hohes Gewicht erhalten (z. B. 0,9). Beachten Sie, dass die Klickgewichtung auch basierend auf vorherigen Klickinformationen angepasst werden kann.
Anstatt nur die Zeitspanne allein zu betrachten, könnten auch zusätzliche Informationen zu den Klickraten der Nutzer in Betracht gezogen werden:
Die verschiedenen Zeitrahmen, die verwendet werden, um kurze, mittlere und lange Klicks zu klassifizieren, und die anzuwendenden Gewichtungen können für eine bestimmte Suchmaschine bestimmt werden, indem historische Daten aus Benutzerauswahlprotokollen mit von Menschen erstelltem explizitem Feedback zur Qualität der Suchergebnisse für verschiedene gegebene Bedingungen verglichen werden Abfragen, und der Gewichtungsprozess kann entsprechend abgestimmt werden.
Wie vor schlechten Daten geschützt werden kann
Wir haben von Google-Sprechern gehört, dass die Klickraten der Nutzer nicht für Rankings verwendet werden, und dieses Patent zeigt uns, wie Nutzer-Feedback-Informationen sicherer verwendet werden können:
Beachten Sie, dass Schutzmaßnahmen gegen Spammer (Benutzer, die betrügerische Klicks generieren, um bestimmte Suchergebnisse zu verbessern) getroffen werden können, um sicherzustellen, dass die Benutzerauswahldaten aussagekräftig sind, selbst wenn für eine bestimmte (seltene) Anfrage nur sehr wenige Daten verfügbar sind. Diese Sicherheitsvorkehrungen können die Verwendung eines Benutzermodells umfassen, das beschreibt, wie sich ein Benutzer im Laufe der Zeit verhalten sollte, und wenn ein Benutzer diesem Modell nicht entspricht, können seine Klickdaten ignoriert werden. Die Sicherheitsvorkehrungen können so gestaltet werden, dass sie zwei Hauptziele erreichen: (1) Gewährleistung der Demokratie bei den Abstimmungen (z. B. eine einzelne Stimme pro Cookie und/oder IP für ein bestimmtes Abfrage-URL-Paar) und (2) vollständige Entfernung der Informationen, die von Cookies oder IP-Adressen, die in ihrem Surfverhalten nicht natürlich aussehen (z. B. abnormale Verteilung von Klickpositionen, Klickdauer, Klicks_pro_Minute/Stunde/Tag usw.). Verdächtige Klicks können entfernt werden, und die Klicksignale für Anfragen, die als Spam erscheinen, müssen nicht verwendet werden (z. B. Anfragen, bei denen die Klicks eine Verteilung von Benutzeragenten, Cookie-Alter usw. aufweisen, die nicht normal aussehen).
Relevanz bestimmt aus der Länge der Ansichten
Uns wird gesagt, dass die Häufigkeit, mit der sich Besucher die Ergebnisse ansehen, ein Hinweis darauf sein kann, wie relevant sie eine Seite finden. Der Begriff „Präsentationsverzerrung“ wird verwendet, um zu beschreiben, wie dies funktionieren könnte
Präsentationsbias umfasst verschiedene Aspekte der Präsentation, wie z. B. ein attraktiver Titel oder Snippet, der mit dem Dokumentergebnis bereitgestellt wird, und wo das Dokumentergebnis in der präsentierten Rangfolge (Position) erscheint. Beachten Sie, dass Benutzer dazu neigen, auf Ergebnisse mit guten Snippets zu klicken oder die im Ranking höher sind, unabhängig von der tatsächlichen Relevanz des Dokuments für die Abfrage im Vergleich zu den anderen Ergebnissen. Durch Bewerten der Qualität eines gegebenen Dokumentergebnisses für eine gegebene Abfrage, unabhängig von den anderen Dokumentergebnissen für die gegebene Abfrage, kann dieses Relevanzmaß relativ immun gegen Darstellungsfehler sein.
Die verwendete Abfrage kann auf einen Informationsbedarf hinweisen, der möglicherweise nicht viel Zeit erfordert und sich in der Zeit widerspiegelt, die jemand möglicherweise auf einer Seite verbringt. Das Patent enthält einige Beispiele für Navigations- und Informationsabfragen:
Somit können im Fall der diskontinuierlichen Gewichtung (und im Fall der kontinuierlichen Gewichtung) die Schwelle(n) (oder die Formel) dafür, was einen guten Klick ausmacht, auf der anfrage- und benutzerspezifischen Grundlage bewertet werden. Zum Beispiel können die Abfragekategorien „navigational“ und „informational“ umfassen, wobei eine Navigationsanfrage eine ist, für die wahrscheinlich eine bestimmte Zielseite oder Site gewünscht wird (z. B. eine Anfrage wie „BMW“), und eine Informationsanfrage ist eine, für die viele mögliche Seiten gleichermaßen nützlich sind (zB eine Abfrage wie „George Washingtons Geburtstag“). Beachten Sie, dass solche Kategorien auch in Unterkategorien unterteilt werden können, wie z. George Washington's Birthday“, aber derselbe Benutzer benötigt möglicherweise viel mehr Zeit, um ein Ergebnis zu bewerten, wenn die Abfrage „Tutorial zur Hilbert-Transformation“ lautet.
Dieses Patent sagt uns auch, wie Dinge wie die Verweilzeit auch in Bezug auf das Benutzerverhalten berücksichtigt werden könnten:
Die Abfragekategorien können durch die Analyse der IR-Scores oder des historischen impliziten Feedbacks identifiziert werden, das von den Klickfraktionen bereitgestellt wird. Beispielsweise kann eine erhebliche Schiefe in einem dieser Dokumente (d. h., dass nur eines oder einige wenige Dokumente anderen gegenüber bevorzugt werden) darauf hinweisen, dass eine Abfrage navigationsbezogen ist. Im Gegensatz dazu können stärker verstreute Klickmuster für eine Abfrage darauf hinweisen, dass die Abfrage informativ ist. Im Allgemeinen kann eine bestimmte Kategorie einer Abfrage identifiziert werden (z. B. Navigation), ein Satz solcher Abfragen kann lokalisiert und aus den historischen Klickdaten gezogen werden, und es kann eine Regressionsanalyse durchgeführt werden, um ein oder mehrere Merkmale zu identifizieren, die auf hinweisen dieser Abfragetyp (z. B. mittlere Verweilzeit für Navigationsabfragen im Vergleich zu anderen Abfragekategorien; der Begriff "Verweilzeit" bezieht sich auf die Zeit, die mit der Anzeige eines Dokumentergebnisses verbracht wird, auch als Dokumentverweilzeit bekannt).
Verschiedene Benutzertypen und Muster und Klicks
Dieses Patent geht auch über die bloße Betrachtung der Benutzer-Click-Through-Raten hinaus, um zu sehen, wie Informationen über verschiedene Benutzer basierend darauf, wie schnell sie klicken und worauf sie klicken, identifiziert werden können. Ich vermute, dass das, was uns hier erzählt wird, nur ein paar Beispiele sind und dass weitere Beobachtungen gefunden wurden, die auf andere hilfreiche Möglichkeiten zur Interpretation solcher Klicks hinweisen könnten:
Benutzertypen können auch durch die Analyse von Klickmustern bestimmt werden. Beispielsweise klicken computererfahrene Benutzer oft schneller als weniger erfahrene Benutzer, und somit können Benutzern basierend auf ihrem Klickverhalten unterschiedliche Gewichtungsfunktionen zugewiesen werden. Diese verschiedenen Gewichtungsfunktionen können sogar vollständig benutzerspezifisch sein (eine Benutzergruppe mit einem Mitglied). Beispielsweise kann die durchschnittliche Klickdauer und/oder Klickhäufigkeit für jeden Benutzer bestimmt werden, und die Schwelle(n) für jeden Benutzer können entsprechend angepasst werden. Benutzer können auch basierend auf verschiedenen Klickverhaltensmustern in Gruppen zusammengefasst werden (z. B. unter Verwendung eines K-Clustering-Algorithmus).
Darüber hinaus kann die Gewichtung basierend auf dem bestimmten Benutzertyp angepasst werden, sowohl in Bezug darauf, wie die Klickdauer in gute Klicks im Vergleich zu weniger guten Klicks übersetzt wird, als auch in Bezug auf die Gewichtung der guten Klicks von a bestimmte Benutzergruppe im Vergleich zu einer anderen Benutzergruppe. Das implizite Feedback einiger Benutzer kann aufgrund der Details des Überprüfungsprozesses eines Benutzers wertvoller sein als die anderer Benutzer. Beispielsweise kann einem Benutzer, der fast immer auf das Ergebnis mit dem höchsten Rang klickt, eine niedrigere Gewichtung zugewiesen werden als einem Benutzer, der häufiger auf Ergebnisse mit einem niedrigeren Rang zuerst klickt (da der zweite Benutzer wahrscheinlich diskriminierender in seiner Einschätzung ist, was ist ein gutes Ergebnis). Außerdem kann ein Benutzer basierend auf seinem Abfragestrom klassifiziert werden. Bei Nutzern, die viele Anfragen zu (oder zu) einem bestimmten Thema T stellen (z. B. Anfragen zu Rechtsfragen), kann ein hohes Maß an Fachwissen zu dem bestimmten Thema T vermutet werden, und ihre Klickdaten können für andere entsprechend gewichtet werden Anfragen von ihnen zu (oder in Bezug auf) dem gegebenen Thema T.
Benutzer-Click-Through-Raten-Patente von Hyung-Jin Kim
Einer der Erfinder des Patents, über das ich heute schreibe, ist Hyung-Jin Kim. Ich habe seinen Namen schon einmal kennengelernt.
Auch ein interessanter Blog Post von AJ Kohn über ein von ihm miterfundenes Patent ist einen Blick wert. Ist Click-Through-Rate ein Ranking-Signal?.
Ein anderer Beitrag, der sich mit einem Patent desselben Erfinders befasst, ist einer, den ich mit dem Titel Using Query User Data to Classify Querys geschrieben habe. Hyung-Jin Kim ist nicht der einzige Google Search Engineer, der über die Klickraten von Nutzern schreibt.
Ich habe auch einige Patente von Navneet Panda gesehen (ja, nach dem das Google Panda Update benannt ist), der über die Möglichkeit geschrieben hat, dass Google aus den Klickraten und dem Benutzerverhalten der Benutzer lernt, was das Suchranking beeinflussen kann
Ich habe auch den Beitrag The Long Click and the Quality of Search Success über ein Patent geschrieben, in dem die Verweildauer einer Person auf einer Seite als Hinweis auf die Qualität dieser Seite untersucht wurde. Es scheint, dass der lange Klick eine Metrik ist, der die Leute von Google viel Aufmerksamkeit geschenkt haben und die eng mit den Klickraten der Benutzer zusammenhängt.

