In che modo il motore di ricerca lavoro di Google utilizza l'apprendimento automatico

Pubblicato: 2018-04-27

Recentemente alcune persone mi hanno chiesto perché penso sia importante condividere brevetti che descrivono cose che un motore di ricerca potrebbe offrire, come un motore di ricerca di lavoro aggiunto di recente Lo scopo legale dietro un brevetto è dare a un titolare di brevetto la possibilità di escludere altri dall'utilizzare il loro stesso processo e impedire ad altri di violare le loro invenzioni. Il compromesso dietro tale esclusione è un requisito che i brevetti finiscano per essere pubblicati, per dare ad altri esempi di come le persone stanno innovando per cercare di superare i problemi, che possono essere fonte di ispirazione, e dare alle persone alcune intuizioni sui presupposti che tali inventori possono avere sulla ricerca e ricercatori e il Web.

Il motore di ricerca di lavoro di Google

È sempre divertente quando Google introduce alcune nuove funzionalità e, quindi, cercando nuovi brevetti dal motore di ricerca, quella nuova funzionalità è oggetto di uno di quei brevetti. Ad esempio, potresti aver notato che Google ha introdotto un motore di ricerca di lavoro di Google, come puoi vedere i risultati da qui:

Risultati della ricerca di lavoro di Google

Ci sono stati articoli su quel motore di ricerca di lavoro:

Il motore di ricerca dei lavori di Google ottiene intervalli di stipendio, un filtro di posizione migliore e altro ancora

Ci sono anche pagine della Guida di Google su Google Job Search:

Cerca lavori su Google

Se Google avviasse un motore di ricerca oggi...

Il nuovo brevetto ha un nome molto semplice, “Search Engine”. Poiché ha adottato questo approccio, mi sono chiesto come potrebbe essere Google se le persone che ci lavorano iniziassero a costruirlo oggi. Ho trovato interessante che includessero queste definizioni di cosa sia un motore di ricerca, che inizia la descrizione del brevetto:

Un motore di ricerca può essere generalmente descritto come qualsiasi programma che esegue una ricerca e recupera i dati memorizzati. Tuttavia, in base all'attività da svolgere, un motore di ricerca può essere configurato in una varietà di modi diversi. Ad esempio, alcuni motori di ricerca possono essere configurati per eseguire ricerche e recuperi basati su parole chiave. Tali motori di ricerca possono identificare risultati di ricerca rilevanti in base, almeno in parte, al numero di volte in cui un termine di ricerca appare in una particolare risorsa o sui metadati della particolare risorsa. In alternativa, o anche, alcuni motori di ricerca possono identificare i risultati di ricerca come rispondenti a una query perché un fornitore di risorse ha pagato al fornitore del motore di ricerca una somma di denaro per restituire le risorse del fornitore in risposta a query di ricerca che includono un particolare termine di ricerca . Tuttavia, i modi summenzionati in cui un motore di ricerca può identificare i risultati di ricerca che rispondono a una query sono semplicemente esemplificativi.

Un motore di ricerca può anche essere configurato per identificare i risultati di ricerca che rispondono a una query in una varietà di altri modi. Una configurazione personalizzata di un motore di ricerca può essere utilizzata, se necessario, per risolvere particolari problemi relativi alla ricerca e al reperimento. La personalizzazione di un motore di ricerca può includere la modifica del modo in cui un motore di ricerca esegue una ricerca, identifica i risultati di ricerca pertinenti, classifica i risultati di ricerca identificati o simili.

Espansione delle ricerche per parole chiave nel motore di ricerca del lavoro di Google

Questo brevetto si concentra su una ricerca di lavoro, piuttosto che su tutte le ricerche. Va in modo più approfondito nel descrivere i dettagli dietro ciò che Google sta offrendo con la ricerca di lavoro e perché l'implementazione di Google della ricerca di lavoro potrebbe essere un miglioramento rispetto alle ricerche di lavoro offerte altrove:

In alcune implementazioni, viene fornito un modello di identificazione del lavoro che migliora la ricerca del lavoro migliorando la qualità dei risultati della ricerca forniti in risposta a una query di ricerca del lavoro. I risultati della ricerca sono migliorati perché il modello di identificazione del lavoro è in grado di identificare annunci di lavoro rilevanti che altrimenti passerebbero inosservati agli algoritmi convenzionali a causa delle limitazioni intrinseche della ricerca basata su parole chiave. Impiegando metodi aggiuntivi diversi o in aggiunta alla ricerca convenzionale basata su parole chiave, il modello di identificazione del lavoro può identificare annunci di lavoro rilevanti che includono titoli di lavoro che non corrispondono alle parole chiave di una query di ricerca di lavoro ricevuta. Ad esempio, in risposta a una query di ricerca di lavoro che cerca opportunità di lavoro per un "Patent Guru", il modello di identificazione del lavoro può identificare offerte di lavoro relative a un "avvocato specializzato in brevetti", un "avvocato della proprietà intellettuale", un "avvocato" o il simile.

Il brevetto ce lo fa intravedere in questo disegno che lo accompagna:

È interessante che questa ricerca si estenda alla ricerca basata su parole chiave in questo modo. Gli inventori ci forniscono alcune informazioni su come l'apprendimento automatico gioca un ruolo nell'aiutare ad andare oltre la corrispondenza delle parole chiave in una query alle offerte di lavoro, come descrivono qui:

Secondo un'implementazione, l'oggetto di questa specifica può essere incorporato in un metodo per facilitare la ricerca di lavoro. Il metodo può includere azioni di definizione di un vocabolario vettoriale, definizione di una tassonomia di occupazione che includa più occupazioni diverse, ottenimento di più elementi di dati di formazione etichettati, in cui ciascun elemento di dati di formazione etichettato è associato ad almeno (i) un titolo di lavoro e (ii) un'occupazione, generando, per ciascuno dei rispettivi elementi di dati di formazione etichettati, un vettore di occupazione che include un peso caratteristica per ciascun rispettivo termine nel vocabolario vettoriale, associando ciascun rispettivo vettore di occupazione con un'occupazione nella tassonomia dell'occupazione basata sull'occupazione del elemento di dati di formazione etichettato utilizzato per generare il vettore di occupazione, ricevere una query di ricerca che include una stringa relativa a una caratteristica di una o più potenziali opportunità di lavoro, generare un primo vettore basato sulla query ricevuta, determinare, per ciascuna rispettiva occupazione del multiplo professioni nella tassonomia delle occupazioni, un punteggio di confidenza che è indicativo del fatto che il vettore di queryè classificato correttamente nella rispettiva occupazione, selezionando la particolare occupazione associata al punteggio di confidenza più elevato, ottenendo uno o più annunci di lavoro utilizzando l'occupazione selezionata e fornendo gli annunci di lavoro ottenuti in una serie di risultati di ricerca in risposta alla query di ricerca .

Una tassonomia occupazionale per il motore di ricerca del lavoro

Il brevetto ci racconta come potrebbe essere ulteriormente sviluppata la tassonomia occupazionale su cui si basano le ricerche di lavoro:

Le operazioni possono includere ricevere una query di ricerca che include una stringa relativa a una caratteristica di una o più opportunità di lavoro, generare, sulla base della query ricevuta, un vettore di query che include un peso di caratteristica per ogni rispettivo termine in un vocabolario vettoriale predeterminato, determinare , per ciascuna rispettiva occupazione delle molteplici occupazioni nella tassonomia delle occupazioni, un punteggio di confidenza che è indicativo se il vettore di query è classificato correttamente nella rispettiva occupazione, selezionando la particolare occupazione che è associata al punteggio di confidenza più alto, ottenendo uno o più annunci di lavoro utilizzando l'occupazione selezionata e fornendo gli annunci di lavoro ottenuti in una serie di risultati di ricerca in risposta alla query di ricerca.

Pesi delle caratteristiche nei termini di occupazione nel motore di ricerca di lavoro

Il brevetto espande anche il peso delle caratteristiche per i termini nelle query per il motore di ricerca di lavoro:

In alcune implementazioni, il peso della caratteristica può essere basato, almeno in parte, su un primo valore che rappresenta una frequenza di termine che è determinata, basata almeno in parte, su diverse occorrenze di ciascun rispettivo termine nel titolo di lavoro dei rispettivi dati di formazione elemento. In alternativa, o in aggiunta, il peso della caratteristica può essere basato, almeno in parte, su un secondo valore che rappresenta una frequenza di occupazione inversa che è determinata sulla base, almeno in parte, di più occupazioni nella tassonomia occupazionale in cui ciascun rispettivo termine nel lavoro sia presente il titolo del rispettivo elemento dei dati di allenamento. In alternativa, o in aggiunta, il peso della caratteristica può essere basato, almeno in parte, su un terzo valore che rappresenta un derivato occupazionale che si basa, almeno in parte, su una densità di ciascun rispettivo termine nel titolo di lavoro dei rispettivi dati di formazione elemento attraverso ciascuna delle rispettive occupazioni nella tassonomia delle occupazioni.

In alcune implementazioni, il peso delle caratteristiche può essere basato, almeno in parte, su entrambi (i) un secondo valore che rappresenta la frequenza di occupazione inversa che è determinata in base, almeno in parte, a diverse occupazioni nella tassonomia delle occupazioni in cui ogni rispettivo termine nella qualifica del rispettivo dato di formazione è presente e (ii) un terzo valore che rappresenta un derivato occupazionale che si basa, almeno in parte, su una densità di ciascun rispettivo termine nel titolo della mansione del rispettivo dato di formazione attraverso ciascuna delle rispettive occupazioni nella tassonomia delle occupazioni. In alternativa, il peso della caratteristica può essere basato su una somma di (i) il secondo valore che rappresenta la frequenza di occupazione inversa e (ii) un terzo del terzo valore che rappresenta la derivata dell'occupazione.

Il brevetto del motore di ricerca di lavoro

(US20180107983) MOTORE DI RICERCA

Numero di domanda: 15296230
Data della domanda: 18.10.2016
Numero di pubblicazione: 20180107983
Data di pubblicazione: 19.04.2018
Inventori: Seyed Reza Mir Ghaderi, Xuejun Tao, Ye Tian, ​​Matthew Courtney, Pei-Chun Chen e Christian Posse

Astratto:

Metodi, sistemi e apparati, compresi programmi per computer codificati su dispositivi di archiviazione, per eseguire una ricerca di opportunità di lavoro. In un aspetto, un sistema include un apparato di elaborazione dati e un dispositivo di memorizzazione leggibile da computer in cui sono memorizzate istruzioni che, quando eseguite dall'apparato di elaborazione dati, fanno sì che l'apparato di elaborazione dati esegua operazioni. Le operazioni includono la definizione di un vocabolario vettoriale, la definizione di una tassonomia di occupazione che includa più occupazioni diverse, l'ottenimento di più elementi di dati di formazione etichettati, in cui ogni elemento di dati di formazione etichettato è associato ad almeno (i) un titolo di lavoro e (ii) un'occupazione, generando, per ciascuno dei rispettivi elementi di dati di formazione etichettati, un vettore di occupazione che include un peso caratteristica per ciascun rispettivo termine nel vocabolario vettoriale e associando ciascun rispettivo vettore di occupazione con un'occupazione nella tassonomia di occupazione basata sull'occupazione dei dati di formazione etichettati elemento utilizzato per generare il vettore di occupazione.