Google zeigt uns, dass der Kontext bei der Indexierung von Personen entscheidend ist

Veröffentlicht: 2017-12-12

Der Kontext ist König

Manchmal werden Sie jemanden sehen, der über SEO schreibt, dass „Content is King“. Aber wenn ich das sehe, bin ich oft versucht, mit „Der Kontext ist König“ zu antworten.

Die richtigen Worte zur richtigen Zeit, die die Absicht des Suchenden erfüllen, können seine Informations- oder sogar situativen Bedürfnisse erfüllen. Wenn Sie eine Seite schreiben, sollten Sie Wörter einschließen, die den Kontext von Schlüsselwörtern hervorheben können, auf die Sie sich bei der Erstellung konzentrieren können.

Weitere Patente zum Kontext

In letzter Zeit bin ich auf Patente von Google aufmerksam geworden, die sich auf den Kontext konzentrieren. Eines der ersten war ein Patent über Kontextvektoren. Über diese Kontextvektoren habe ich im Beitrag geschrieben: Google Patents Context Vectors to Improve Search.

In dem Beitrag Liefert Tomorrow Topical Search Results at Google?, schrieb ich über ein Google-Patent, das uns sagte, dass Suchmaschinen vor jedem Suchergebnis Breadcrumbs anzeigen können, die die Bedeutung eines Abfragebegriffs anzeigen könnten, der mehr als eine Bedeutung haben kann .

Nachdem ich festgestellt habe, dass Google beim Indexieren von Seiten und bei der Anzeige von Seiten in Suchergebnissen mehr auf den Kontext achtet, erregte das Wort „Kontext“ in einem sehr aktuellen Patent von Google meine Aufmerksamkeit. Vor allem, als ich „Namensdisambiguierung mit Kontextbegriffen“ gesehen habe, über die ich heute schreibe.

Betrachten Sie einen gebräuchlichen Namen wie John Smith. Es gibt einen bekannten John Smith aus England, der dafür bekannt ist, die Kolonie Jamestown, die erste dauerhafte englische Siedlung in Nordamerika, zu entdecken. Es gibt einen anderen John Smith, der als Botaniker bekannt war. Dieses Patent sagt uns, dass es einige Kontextvokabularbegriffe identifizieren könnte, die jedem John Smith zugeordnet werden könnten. Wenn also jemand nach John Smith und Kew Gardens sucht, sucht er wahrscheinlich nach dem Botaniker. Eine andere Person, die nach John Smith und Virginia sucht, sucht wahrscheinlich nach dem Entdecker.

Dieses Patent identifiziert das Problem, das es mit ähnlichen Beispielen lösen soll:

Ein sehr beliebtes Suchszenario ist die Suche nach Personennamen. Da die meisten Personennamen nicht eindeutig sind, kann eine anfängliche Suche nach dem Namen einer Person zu mehreren Suchergebnissen führen, die jeweils auf Ressourcen verweisen, die unterschiedliche Personen beschreiben. Beispielsweise kann eine Suche nach dem Namen „John Smith“ Suchergebnisse liefern, die auf Ressourcen mit Informationen über einen Entdecker, Ressourcen über einen Botaniker und Kurator von Kew Gardens, Ressourcen über einen professionellen Wrestler und noch andere Ressourcen über andere Personen verweisen, die heißen „John Smith“. Da Suchanfragen oft unvollständige Angaben zu den benötigten Informationen sind, wird der Benutzer die Suchanfrage oft überarbeiten, um sich auf die Suchergebnisse zu konzentrieren. Solche Überarbeitungen umfassen das Hinzufügen zusätzlicher Suchbegriffe zum Namen. Angenommen, der Benutzer sucht beispielsweise nach Informationen zu den Interaktionen des Entdeckers John Smith mit Chief Powhatan. Der Benutzer kann die Abfrage so überarbeiten, dass sie „John Smith Chief Powhatan“ lautet. Die Suchabfrage veranlasst eine Suchmaschine, Suchergebnisse bereitzustellen, die auf Dokumente verweisen, die mit größerer Wahrscheinlichkeit die Informationsbedürfnisse des Benutzers erfüllen.

Wenn Wikipedia einen Eintrag zu mehr als einer Person mit demselben Namen hat, enthält dieser Informationen zur Begriffsklärung. Neben dem Namen der Person kann es weitere Begriffe enthalten, um zu identifizieren, auf welche Person Bezug genommen wird. Im Fall von John Smiths, über den ich schreibe, kann das sein:

John Smith (Botaniker)
John Smith (Entdecker)

Diese repräsentativen Begriffe können aus Suchvorschlägen entnommen werden:

Die Abfragebegriffe und repräsentativen Begriffe können wie in Wikipedia gefundene Begriffsklärungen aussehen:

Wikipedia-Vorschläge zur Begriffsklärung

Im Patent nicht erwähnt ist, dass wir möglicherweise Wissenspanels sehen, die jeden dieser verschiedenen John Smiths identifizieren:

Der John Smith (Entdecker):

John Smith (Botaniker):

Wie verfolgt Google die verschiedenen John Smiths?

1. Kontextbegriffslisten werden für die Namen einer Person erstellt:

…jede Kontextbegriffsliste eine Liste von Kontextbegriffen aus einer Ressource für den Personennamen ist und jede der Ressourcen, denen die Kontextbegriffslisten für den Personennamen entsprechen, unterschiedliche Ressourcen ist; Clustern der Kontextbegriffslisten in eine Vielzahl von Clustern, wobei jeder der Cluster von Kontextbegriffslisten Kontextbegriffslisten enthält, die dem Cluster relativ zu anderen Clustern am ähnlichsten sind; für jeden der Cluster, Auswählen eines repräsentativen Begriffs für den Cluster; Empfangen des Personennamens als Suchanfrage; und Erzeugen einer Vielzahl von Abfragevorschlägen aus der Suchabfrage und den repräsentativen Begriffen für die Cluster, wobei jede Abfrage vorschlägt, eine Kombination aus dem Personennamen und einem repräsentativen Begriff zu sein.

2. Vorteile dieses Kontextansatzes laut Patent:

Benutzern werden Abfragevorschläge für persönliche Namen bereitgestellt, und jeder Vorschlag ist repräsentativ für einen Kontext, der mit dem Namen verbunden ist. Jeder Kontext wird verwendet, um den Namen eindeutig zu machen, und somit kann der Benutzer eine Suche schnell auf einen geeigneten Kontext konzentrieren, ohne die verschiedenen Kontexte manuell bestimmen zu müssen. Personennamen, die ansonsten eine dominante Interpretation hätten (z. B. Namen berühmter Personen oder historischer Persönlichkeiten), werden innerhalb von Kontexten disambiguiert, und die dominante Interpretation ist auf eine richtige Teilmenge der Kontexte beschränkt. Dementsprechend kann das System Abfragevorschläge für die dominante Interpretation und mehrere andere Kontexte bereitstellen, die nicht mit der dominanten Interpretation verbunden sind.

3. Ressourcen, die sich auf dieselbe Person beziehen (dh ein Name, der zwischen Kontexten eindeutig ist) können separat gruppiert werden.

Andere Begriffe, die mehr als eine Bedeutung haben können, wie Jaguar, können Ergebnisse separat gruppieren. Zum Beispiel das Jaguar Car, die Jaguar-Katze und die Jacksonville Jaguar NFL-Football-Spieler.

Das Kontextpatent

Das Patent zu Kontext und Namen finden Sie unter:

Namensklärung mit Kontextbegriffen
Erfinder: Nitin Gupta und Abhinandan S. Das
Rechtsnachfolger: Google Inc.
US-Patent: 9.830.379
Bewilligt: ​​28. November 2017
Gespeichert: 29. November 2010

Abstrakt

Verfahren, Systeme und Vorrichtungen, einschließlich Computerprogrammen, die auf einem Computerspeichermedium codiert sind, um Namen in einem Dokumentenkorpus eindeutig zu machen. In einem Aspekt umfasst ein Verfahren das Erzeugen von Kontextbegriffslisten für einen Personennamen, wobei jede Kontextbegriffsliste eine Liste von Kontextbegriffen aus einer Ressource für den Personennamen ist; Clustern der Kontextbegriffslisten in eine Vielzahl von Clustern, wobei jeder der Cluster von Kontextbegriffslisten Kontextbegriffslisten enthält, die dem Cluster relativ zu anderen Clustern am ähnlichsten sind; für jeden der Cluster, Auswählen eines repräsentativen Begriffs für den Cluster; Empfangen des Personennamens als Suchanfrage; und Erzeugen einer Vielzahl von Abfragevorschlägen aus der Suchabfrage und den repräsentativen Begriffen für die Cluster, wobei jede Abfrage vorschlägt, eine Kombination aus dem Personennamen und einem repräsentativen Begriff zu sein.

Take-Aways

Ähnlich wie im Patent über Kontextvektoren beschrieben, können Wissensdatenbanken helfen, Informationen über potenziell einzigartige Personen zu finden. Michael Jackson zum Beispiel war ein bekannter Popular Singer. Es gab auch einen Michael Jackson, der ein Administrator des Heimatschutzministeriums war. Wir können dies von der Michael Jackson (Begriffsklärung) Seite lernen. Es ist möglich, Begriffe zu verwenden, die dabei helfen, den Kontext für jede dieser Bedeutungen und Personen zu definieren.

Dieses Begriffsklärungspatent sagt uns, dass die Abfragen, die zum Auffinden von Seiten verwendet werden, uns verschiedene Kontexte zeigen können, die mit den Namen von Personen verbunden sind. Wenn Sie eine Seite für eine bestimmte Person optimieren, ist es sinnvoll, Kontextbegriffe einzuschließen, die dabei helfen, zu definieren, über wen Sie schreiben.

Wenn es möglich ist, Begriffe zu verwenden, die den Kontext für eine Person definieren, kann das Einschließen dieser Begriffe auf Seiten, die Sie über sie erstellen, bei der Indexierung der richtigen Person helfen, indem auf den Kontext geachtet wird.