Wie die Jobsuchmaschine von Google maschinelles Lernen nutzt

Veröffentlicht: 2018-04-27

In letzter Zeit haben mich einige Leute gefragt, warum ich es für wichtig halte, Patente zu teilen, die Dinge beschreiben, die eine Suchmaschine bieten könnte, wie eine kürzlich hinzugefügte Jobsuchmaschine Der rechtliche Zweck eines Patents besteht darin, einem Patentinhaber die Möglichkeit zu geben, andere davon ausschließen, dasselbe Verfahren wie sie zu verwenden, und andere davon abhalten, ihre Erfindungen zu verletzen. Der Kompromiss hinter einem solchen Ausschluss ist eine Anforderung, dass Patente schließlich veröffentlicht werden, um anderen Beispiele dafür zu geben, wie Menschen innovativ sind, um zu versuchen, Probleme zu überwinden, was inspirierend sein kann, und den Menschen einen Einblick in die Annahmen geben, die solche Erfinder über die Suche haben können , Suchende und das Web.

Die Jobsuchmaschine von Google

Es macht immer Spaß, wenn Google einige neue Funktionen einführt und dann neue Patente von der Suchmaschine durchsucht, diese neue Funktion ist Gegenstand eines dieser Patente. Sie haben zum Beispiel vielleicht bemerkt, dass Google eine Google-Stellensuchmaschine eingeführt hat, wie Sie hier die Ergebnisse sehen können:

Ergebnisse der Google-Stellensuche

Es gab Artikel über diese Jobsuchmaschine:

Die Jobsuchmaschine von Google erhält Gehaltsspannen, einen besseren Standortfilter und mehr

Es gibt auch Google-Hilfeseiten zur Google-Stellensuche:

Jobsuche bei Google

Wenn Google heute eine Suchmaschine starten würde…

Das neue Patent hat einen sehr einfachen Namen, „Suchmaschine“. Da dieser Ansatz verfolgt wurde, fragte ich mich, wie Google wohl aussehen würde, wenn die Leute, die daran arbeiten, heute mit der Entwicklung beginnen würden. Ich fand es interessant, dass sie diese Definitionen von einer Suchmaschine enthalten, die die Beschreibung des Patents beginnt:

Eine Suchmaschine kann allgemein als ein beliebiges Programm beschrieben werden, das eine Suche ausführt und gespeicherte Daten abruft. Je nach Aufgabenstellung kann eine Suchmaschine jedoch auf unterschiedliche Weise konfiguriert werden. Zum Beispiel können einige Suchmaschinen so konfiguriert sein, dass sie eine schlüsselwortbasierte Suche und Abfrage durchführen. Solche Suchmaschinen können relevante Suchergebnisse zumindest teilweise basierend auf der Häufigkeit identifizieren, mit der ein Suchbegriff in einer bestimmten Ressource vorkommt, oder auf den Metadaten der bestimmten Ressource. Alternativ oder auch können einige Suchmaschinen Suchergebnisse als auf eine Anfrage reagierend identifizieren, weil ein Ressourcenanbieter dem Suchmaschinenanbieter einen Geldbetrag gezahlt hat, um die Ressource(n) des Anbieters als Reaktion auf Suchanfragen, die einen bestimmten Suchbegriff enthalten, zurückzugeben . Die oben genannten Möglichkeiten, mit denen eine Suchmaschine Suchergebnisse als Reaktion auf eine Abfrage identifizieren kann, sind jedoch lediglich beispielhaft.

Eine Suchmaschine kann auch so konfiguriert werden, dass sie Suchergebnisse als Reaktion auf eine Abfrage auf verschiedene andere Weise identifiziert. Eine benutzerdefinierte Konfiguration einer Suchmaschine kann nach Bedarf verwendet werden, um bestimmte Probleme im Zusammenhang mit der Suche und dem Abruf zu lösen. Das Anpassen einer Suchmaschine kann das Ändern der Art und Weise umfassen, wie eine Suchmaschine eine Suche ausführt, relevante Suchergebnisse identifiziert, identifizierte Suchergebnisse einordnet oder dergleichen.

Erweiterung der Keyword-Suche in der Jobsuchmaschine von Google

Dieses Patent konzentriert sich eher auf eine Stellensuche als auf alle Suchen. Es wird ausführlicher beschrieben, was die Jobsuche von Google angeht und warum die Implementierung der Jobsuche durch Google eine Verbesserung gegenüber der Jobsuche sein könnte, die anderswo angeboten wird:

In einigen Implementierungen wird ein Jobidentifikationsmodell bereitgestellt, das die Jobsuche verbessert, indem die Qualität der Suchergebnisse verbessert wird, die als Reaktion auf eine Jobsuchanfrage bereitgestellt werden. Die Suchergebnisse werden verbessert, da das Job-Identifikationsmodell in der Lage ist, relevante Stellenausschreibungen zu identifizieren, die ansonsten von herkömmlichen Algorithmen aufgrund der inhärenten Einschränkungen der schlüsselwortbasierten Suche unbemerkt bleiben würden. Durch Anwenden zusätzlicher Verfahren außer oder zusätzlich zu der herkömmlichen schlüsselwortbasierten Suche kann das Jobidentifizierungsmodell relevante Jobausschreibungen identifizieren, die Jobtitel enthalten, die nicht mit den Schlüsselwörtern einer empfangenen Jobsuchanfrage übereinstimmen. Als Reaktion auf eine Jobsuchanfrage, die nach Stellenangeboten für einen „Patent-Guru“ sucht, kann das Job-Identifizierungsmodell beispielsweise Stellenausschreibungen identifizieren, die sich auf einen „Patentanwalt“, einen „Anwalt für geistiges Eigentum“, einen „Rechtsanwalt“ beziehen oder dergleichen.

Einen Eindruck davon gibt uns das Patent in dieser beigefügten Zeichnung:

Interessant ist, dass diese Suche eine solche stichwortbasierte Suche erweitert. Die Erfinder geben uns einige Einblicke in die Rolle des maschinellen Lernens, die dabei hilft, über das Abgleichen von Schlüsselwörtern in einer Abfrage hinaus auf Stellenausschreibungen zu gehen, wie sie hier beschreiben:

Gemäß einer Implementierung kann der Gegenstand dieser Spezifikation in einem Verfahren verkörpert sein, um die Jobsuche zu erleichtern. Das Verfahren kann Aktionen zum Definieren eines Vektorvokabulars, zum Definieren einer Berufstaxonomie, die mehrere verschiedene Berufe umfasst, zum Erhalten mehrerer gekennzeichneter Trainingsdatenelemente umfassen, wobei jedes gekennzeichnete Trainingsdatenelement mindestens (i) einer Berufsbezeichnung und (ii) zugeordnet ist. eine Besetzung, die für jedes der jeweiligen gekennzeichneten Trainingsdatenelemente einen Besetzungsvektor erzeugt, der ein Merkmalsgewicht für jeden jeweiligen Begriff im Vektorvokabular enthält, wobei jeder jeweilige Besetzungsvektor einer Besetzung in der Besetzungstaxonomie basierend auf der Besetzung des zuordnet gekennzeichnetes Trainingsdatenelement, das zum Generieren des Besetzungsvektors verwendet wird, Empfangen einer Suchanfrage, die eine Zeichenfolge enthält, die sich auf ein Merkmal einer oder mehrerer potenzieller Stellenangebote bezieht, Generieren eines ersten Vektors basierend auf der empfangenen Anfrage, Bestimmen für jede jeweilige Besetzung des Vielfachen Berufe in der Berufstaxonomie, ein Konfidenzwert, der anzeigt, ob der Abfragevektorkorrekt in den jeweiligen Beruf eingeordnet wird, den bestimmten Beruf mit dem höchsten Vertrauenswert auswählen, eine oder mehrere Stellenausschreibungen mit dem ausgewählten Beruf abrufen und die erhaltenen Stellenausschreibungen als Antwort auf die Suchanfrage in einer Menge von Suchergebnissen bereitstellen .

Eine Berufstaxonomie für die Jobsuchmaschine

Das Patent sagt uns, wie die Berufstaxonomie, auf der die Stellensuche basiert, auch weiterentwickelt werden könnte:

Die Operationen können das Empfangen einer Suchabfrage beinhalten, die eine Zeichenfolge enthält, die sich auf ein Merkmal einer oder mehrerer Stellenangebote bezieht, Erzeugen eines Abfragevektors, der eine Merkmalsgewichtung für jeden jeweiligen Begriff in einem vorbestimmten Vektorvokabular enthält, basierend auf der empfangenen Abfrage, Bestimmen , für jeden jeweiligen Beruf der mehreren Berufe in der Berufstaxonomie, einen Konfidenzwert, der anzeigt, ob der Abfragevektor in dem jeweiligen Beruf richtig klassifiziert ist, Auswählen des bestimmten Berufes, der mit dem höchsten Konfidenzwert assoziiert ist, Erhalten eines oder mehrerer Stellenausschreibungen, die den ausgewählten Beruf verwenden, und Bereitstellen der erhaltenen Stellenausschreibungen in einem Satz von Suchergebnissen als Reaktion auf die Suchanfrage.

Merkmalsgewichtungen in Berufsbezeichnungen in der Jobsuchmaschine

Das Patent erweitert das Merkmalsgewicht für Begriffe in Abfragen für die Jobsuchmaschine auch:

In einigen Implementierungen kann die Merkmalsgewichtung zumindest teilweise auf einem ersten Wert basieren, der eine Begriffshäufigkeit darstellt, die zumindest teilweise basierend auf mehreren Vorkommen jedes jeweiligen Begriffs in der Berufsbezeichnung der jeweiligen Trainingsdaten bestimmt wird Artikel. Alternativ oder daneben kann die Merkmalsgewichtung zumindest teilweise auf einem zweiten Wert basieren, der eine inverse Berufshäufigkeit darstellt, die zumindest teilweise basierend auf mehreren Berufen in der Berufstaxonomie bestimmt wird, wobei jeder jeweilige Begriff im Job Titel des jeweiligen Trainingsdatenelements vorhanden ist. Alternativ oder daneben kann die Merkmalsgewichtung zumindest teilweise auf einem dritten Wert basieren, der eine Berufsableitung darstellt, die zumindest teilweise auf einer Dichte jedes jeweiligen Begriffs in der Berufsbezeichnung der jeweiligen Ausbildungsdaten basiert Item für jeden der jeweiligen Berufe in der Berufstaxonomie.

In einigen Implementierungen kann die Merkmalsgewichtung zumindest teilweise sowohl auf (i) einem zweiten Wert basieren, der die inverse Besetzungshäufigkeit darstellt, die zumindest teilweise basierend auf mehreren Berufen in der Besetzungstaxonomie bestimmt wird, wobei jeder jeweilige Term in der Berufsbezeichnung des jeweiligen Ausbildungsdatenelements vorhanden ist und (ii) ein dritter Wert, der eine Berufsableitung darstellt, die zumindest teilweise auf einer Dichte jedes jeweiligen Begriffs in der Berufsbezeichnung des jeweiligen Ausbildungsdatenelements quer basiert jeden der jeweiligen Berufe in der Berufstaxonomie. Alternativ kann das Merkmalsgewicht auf einer Summe von (i) dem zweiten Wert, der die inverse Besetzungshäufigkeit repräsentiert, und (ii) einem Drittel des dritten Werts, der die Besetzungsableitung repräsentiert, basieren.

Das Jobsuchmaschinenpatent

(US20180107983) SUCHMASCHINE

Anwendungsnummer: 15296230
Bewerbungsdatum: 18.10.2016
Publikationsnummer: 20180107983
Erscheinungsdatum: 19.04.2018
Erfinder: Seyed Reza Mir Ghaderi, Xuejun Tao, Ye Tian, ​​Matthew Courtney, Pei-Chun Chen und Christian Posse

Abstrakt:

Verfahren, Systeme und Geräte, einschließlich auf Speichergeräten codierter Computerprogramme, zum Durchführen einer Jobsuche. In einem Aspekt umfasst ein System eine Datenverarbeitungsvorrichtung und eine computerlesbare Speichervorrichtung mit darauf gespeicherten Anweisungen, die, wenn sie durch die Datenverarbeitungsvorrichtung ausgeführt werden, die Datenverarbeitungsvorrichtung veranlassen, Operationen durchzuführen. Die Operationen beinhalten das Definieren eines Vektorvokabulars, das Definieren einer Berufstaxonomie, die mehrere verschiedene Berufe umfasst, das Erhalten mehrerer gekennzeichneter Trainingsdatenelemente, wobei jedes gekennzeichnete Trainingsdatenelement mindestens (i) einer Berufsbezeichnung und (ii) einem Beruf zugeordnet ist, Generieren eines Besetzungsvektors für jedes der jeweiligen gekennzeichneten Trainingsdatenelemente, der eine Merkmalsgewichtung für jeden jeweiligen Begriff im Vektorvokabular enthält, und Assoziieren jedes jeweiligen Besetzungsvektors mit einer Besetzung in der Berufstaxonomie basierend auf der Besetzung der gekennzeichneten Trainingsdaten Element, das verwendet wird, um den Besetzungsvektor zu erzeugen.