Wie Google Bewertungen verwenden kann, um mehr über Entitätsattribute zu erfahren

Veröffentlicht: 2018-09-06

Entitätsattribute Poster

Über Entitätsattribute

Wenn wir sehen, dass Google über die Eigenschaften verschiedener Entitäten spricht, bezeichnen sie diese oft als Entitätsattribute und definieren sie oft in Schlüssel/Wert-Paaren. Zum Beispiel hat Abraham Lincoln eine Körpergröße von 6'4″. Alphabet ist eine Holdinggesellschaft mit Hauptsitz in Mountain View, Kalifornien. Paul Newman hat blaue Augen. Fortnite ist ein Multiplayer-Spiel.

Einige Online-Rezensionen beziehen sich speziell auf Entitäten wie Produkte, Produktersteller und/oder Produktanbieter. Diese Rezensionen können Informationen über diese Entitätsattribute enthalten, an denen Suchende interessiert sein könnten. Ein Patent, das Google in der letzten Woche erteilt wurde, sagt uns, dass Google Informationen über Entitätsattribute aus Rezensionen sammelt, an denen Suchende möglicherweise interessiert sind, und wie sie dies tun können. Dies ist wichtig, denn wie das Patent uns sagt:

Diese Arten von Benutzerbewertungen können Informationen über Entitäten enthalten, die möglicherweise nicht von den Entitäten selbst bereitgestellt oder generiert wurden.

Informationen zu Entitätsattributen gehen von Bewertungen in den Google-Index über

Dieser Prozess mit Entitätsattributen kann Folgendes umfassen:

(1) Identifizieren , basierend auf einem Korpus von Benutzeranfragen, einer oder mehrerer Kategorien von beobachtetem Benutzerinteresse;
(2) Erkennen eines oder mehrerer Textsegmente, die sich auf eine oder mehrere Kategorien des beobachteten Benutzerinteresses beziehen, in einer oder mehreren Benutzerbewertungen, die mit einem Produkt verbunden sind;
(3) Und basierend auf dem Erkennen und Indizieren des Produkts in einer durchsuchbaren Datenbank in einer oder mehreren Kategorien des beobachteten Benutzerinteresses.

So. Die Suchmaschine kann die Abfragen zu einer Entität untersuchen, um zu ermitteln, was Suchende an diesen Entitäten interessieren könnte, und diese Abfragen verwenden, um Text in Rezensionen zu identifizieren, an denen Suchende interessiert sein könnten, und diesen Text indizieren, damit Suchende Antworten auf die Abfragen, die sie zu Entitäten wie Produkten, Produktherstellern und Produktanbietern haben.

Google kann die Anzahl der Anfragen zu bestimmten Entitätsattributen zählen, um zu ermitteln, wie groß das Interesse an Antworten auf diese Anfragen ist oder welches Interesse der Nutzer daran haben könnte.

Maschinelles Lernen kann verwendet werden, um zu erkennen, ob Anfragen am Produkt selbst oder am Produkthersteller interessiert sind.

Das fragliche Patent für Entitätsattribute, das letzte Woche erteilt wurde, ist zu finden unter:

Analysieren von Benutzerbewertungen, um Entitätsattribute zu bestimmen
Erfinder: Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva und Anna Patterson
Rechtsnachfolger: GOOGLE LLC
US-Patent: 10.061.767
Bewilligt: ​​28. August 2018
Gespeichert: 16. Juni 2017

Abstrakt

Hierin werden Verfahren und Vorrichtungen zum Klassifizieren von Benutzerrezensionen oder Teilen davon als auf verschiedene Entitäten bezogen und zum Assoziieren extrahierter beschreibender Textsegmente, die in diesen Benutzerrezensionen oder Teilen davon enthalten sind, basierend auf den Klassifikationen beschrieben. In verschiedenen Implementierungen können eine oder mehrere Kategorien beobachteten Benutzerinteresses basierend auf einem Korpus von Benutzeranfragen identifiziert werden. Ein oder mehrere Textsegmente, die sich auf die eine oder mehreren Kategorien des beobachteten Benutzerinteresses beziehen, können in einer oder mehreren Benutzerbewertungen, die einem Produkt zugeordnet sind, erkannt werden. Basierend auf der Erkennung kann das Produkt in einer durchsuchbaren Datenbank nach einer oder mehreren Kategorien beobachteten Benutzerinteresses indiziert werden. In einigen Implementierungen kann die durchsuchbare Datenbank für ein oder mehrere entfernte Client-Geräte zugänglich sein und kann durch die eine oder mehreren Kategorien von beobachtetem Benutzerinteresse durchsuchbar sein, um Suchergebnisse bereitzustellen, die von dem einen oder den mehreren entfernten Client-Geräten wiederzugeben sind.

Benutzerbewertungen, wie in diesem Patent beschrieben, können aus folgenden Quellen stammen:

  • Blogs
  • Beiträge in sozialen Netzwerken
  • E-Mails
  • Artikel für Websites oder gedruckte Publikationen wie Zeitschriften oder Zeitungen
  • Beiträge in einem Abschnitt mit Benutzerbewertungen eines Online-Anbieters oder Marktplatzes
  • Benutzerbewertungen, die bei verschiedenen bestehenden Clearinghäusern für Benutzerbewertungen eingereicht wurden

Diese Bewertungen können dann basierend auf den Interessenkategorien, die sie abdecken können, und den Unternehmen, zu denen sie möglicherweise Informationen enthalten, klassifiziert werden. Es ist interessant, weil dieses Patent uns darüber informiert, wie maschinelles Lernen Teil des Prozesses sein kann, der bei diesen Schritten beteiligt ist.

In einigen Implementierungen können eine oder mehrere „Interessenkategorien“ in Entitäten verwendet werden, um Benutzerbewertungen und/oder Teile davon als mit bestimmten Entitäten verwandt zu klassifizieren. Das Erkennen von Wörtern oder Phrasen in einer Benutzerbewertung, die diesen Kategorien entsprechen (z. B. als ausreichend ähnlich), kann als Signale zum Klassifizieren der Benutzerbewertung oder eines Teils davon als auf eine Entität bezogen interpretiert werden. Interessenkategorien können in verschiedenen Formen vorliegen, wie beispielsweise Kategorien von vorhergesagtem Interesse und Kategorien von beobachtetem Interesse. In verschiedenen Implementierungen kann eine Kategorie-Engine einen Index von Kategorien führen, der von der Klassifizierer-Engine verwendet werden kann, um Benutzerbewertungen und/oder Teile davon zu klassifizieren.

Wenn Sie ein Fan von Online-Spielen sind, bietet das Patent mehrere Beispiele, die sich auf diese konzentrieren, um zu beschreiben, wie der Prozess hinter dem Patent funktioniert:

Im Gegensatz dazu können Kategorien beobachteter Interessen bestimmt werden, z. B. durch eine Kategoriemaschine, basierend auf Mustern, die bei der Benutzeraktivität beobachtet werden, wie beispielsweise unter einer Vielzahl (oder einem Korpus) von Benutzeranfragen. Zum Beispiel, und weiter mit dem Beispiel des Online-Marktplatzes für Apps, können mehrere Benutzer nach Apps suchen, die dieselben oder ähnliche Begriffe oder Ausdrücke verwenden. Wenn genügend Benutzer Anfragen stellen, die ein bestimmtes Wort oder eine bestimmte Phrase (oder ähnliche Variationen davon) enthalten, kann die Kategoriemaschine diese Wörter oder Phrasen als eine Kategorie von beobachtetem Interesse betrachten und den Index entsprechend aktualisieren. Wenn also genügend Benutzer einen Online-Marktplatz nach „Massively Multiplayer Online Role-Playing Games“ oder „MMORPG“ durchsuchen, kann eine MMORPG-Kategorie eingerichtet werden.

Prozesse zum Extrahieren von Text aus Bewertungen werden ebenfalls beschrieben und umfassen beispielsweise Vergleiche zwischen verschiedenen Entitäten (z. B. „Produkt X ist besser als Produkt Y“).

Das Patent widmet der Extraktion von Informationen und bestimmten Wörtern und Ausdrücken viel Aufmerksamkeit und reagiert auf Anfragen, beispielsweise wenn es viele Anfragen zu „Kameras mit großartigen optischen Zoomfunktionen“ gäbe extrahiert werden, die diese Abfrage für eine bestimmte Kamera beantwortet haben. Und diese Art von Informationen könnte aus Benutzerbewertungen von Kameras stammen.

Wir erhalten einen Hinweis auf die Auswirkungen solcher Extraktionen:

Die Graph-Engine kann verschiedene Aktionen mit diesen neu zugeordneten Entitätsattributen und/oder Scores ausführen. Zum Beispiel kann die Graph-Engine in einigen Implementierungen mit einer Suchmaschine (nicht dargestellt) verbunden sein und kann eine oder mehrere Entitäten basierend auf einem oder mehreren beschreibenden Textsegmenten indizieren, die mit dieser einen oder mehreren Entitäten verknüpft sind, z. B. durch beschreibenden Text Verein Motor.

Verwendung von Reviews, um mehr über Entitätsattribute zu erfahren

Interessant, dass Google nutzergenerierte Inhalte wie Produktrezensionen verwenden kann, um mehr über diese Produkte, die Hersteller dieser Produkte und die Distributoren der Produkte zu erfahren.

Wir haben festgestellt, dass Google ein Interesse an Rezensionen von Produkten und Unternehmen und Orten hat, weil Suchende danach gesucht haben. Wir haben auch gesehen, wie Google darüber sprach, wie sie Bewertungen verwenden könnten, um die Stimmung in Bezug auf Entitäten zu erfahren. Dieses Patent geht noch einen Schritt weiter und geht über das bloße Bereitstellen von Rezensionen für Suchende oder das Hervorheben von mit Gefühlen gefüllten Sätzen hinaus. Es versucht, Informationen über die überprüften Dinge zu erhalten, um spezifische Interessen mit Informationen abzugleichen, die diese beantworten.

Das Patent sagt uns, wo Online-Rezensionen gefunden werden können, wie Text aus diesen Rezensionen klassifiziert und extrahiert werden kann, wie das Interesse an Suchanfragen von Suchenden durch Crowdsourcing gesammelt werden kann, um zu verstehen, was diese Suchenden möglicherweise lernen möchten, und dass eine Suchmaschine den Suchenden anzeigen könnte Informationen, die diesen Interessen zu bestimmten Entitätsattributen entsprechen.

Vielleicht sind Bewertungen ein guter Ort, um Informationen über Entitätsattribute zu erhalten, die diese Entitäten selbst nicht teilen. Was denkst du?