Google aggiorna il brevetto One Box
Pubblicato: 2017-05-04
Un brevetto di continuazione su Google Oneboxes mostra come i dati sull'esperienza utente avranno probabilmente un ruolo più importante nel determinare se un onebox appare o meno per una serie di risultati di ricerca, inclusi onebox per le query del repository dei fatti, come gli snippet in primo piano
Quello che sapevamo di una scatola
Nel 2007, ho scritto di un brevetto in Search Engine Land che ho intitolato OneBox Patent Application di Google. Ciò che quel brevetto ci diceva era che a volte Google poteva aggiungere un altro risultato in cima a una serie di risultati di ricerca e quel risultato extra poteva provenire da alcuni risultati di ricerca verticali o repository diversi. Se la query cercata era qualcosa che appare nei risultati di ricerca di notizie, potrebbe essere visualizzata una casella di risultati di notizie. Se molte persone stavano guardando immagini di giaguari nella ricerca immagini e la query era "giaguaro", allora è possibile che la scatola contenga immagini di giaguari. Se stavo cercando da Jacksonville, ed era un lunedì dopo una domenica piena di partite della NFL, inclusa una con i Jacksonville Jaguars, la scatola potrebbe contenere una storia sportiva su una partita dei Jaguars.
Modifiche a One Box
A Google è stata concessa una versione aggiornata del brevetto da quel post di questa settimana che sembra aver scelto uno dei tanti metodi descritti nella versione precedente del brevetto. La versione più recente del brevetto è un brevetto di continuazione, che prende la data di deposito della versione originale, ma aggiorna la sezione dei reclami per riflettere come viene utilizzato il processo che protegge.
Nel post di SearchEngineLand, ho scritto su come Google potrebbe identificare e utilizzare determinati dati per capire quali repository mostrare i risultati. Quel brevetto descriveva almeno sette diversi metodi che potrebbe utilizzare per determinare quale tipo di dati mostrare ai ricercatori. Uno di questi era il metodo dal suono più interessante, quindi ne ho scritto nel mio post. Il brevetto di continuazione sembra indicare questo metodo come l'approccio utilizzato per decidere su un repository:
Una variante descrive un processo in cui vengono raccolti i dati di registro sui ricercatori e le ricerche nei repository. I dati di registro sono rappresentati come triple di dati (u, q, r), dove u sono informazioni sui ricercatori, q come informazioni sulla query e r sono informazioni sui repository da cui sono stati forniti i risultati della ricerca. Vengono create etichette per ciascuna delle triple di dati (u, q, r), in cui l'etichetta include informazioni sul fatto che l'utente u desiderasse informazioni dal repository r quando l'utente ha fornito la query di ricerca q. Le istruzioni vengono create per addestrare un modello basato sulle triple di dati (u, q, r) e le loro etichette associate, per prevedere se un particolare utente desidera informazioni da determinati repository quando fornisce una particolare query di ricerca.
Repository selezionati per una casella in base ai dati dell'utente inclusi i clic
Un repository è una raccolta di dati che si concentra su un determinato aspetto della ricerca, come ricerche basate su notizie, ricerche basate su immagini, ricerche locali. Questi diversi tipi di ricerche hanno i loro fattori di ranking unici e i loro risultati. Google ci ha parlato di un repository Fact-Based navigabile da cui provengono i risultati del tipo di risposta alle query come gli snippet in primo piano. È interessante notare che è probabile che Google utilizzi le informazioni sui dati dell'utente per decidere quale repository mostrare i risultati. Quindi, quando qualcuno decide di fare clic su un determinato risultato, clic del genere si potrebbe determinare cosa vedono gli altri che scelgono la stessa query con cui cercare

Vale la pena guardare le rivendicazioni nella nuova versione di un brevetto, come la versione aggiornata e protetta del processo descritto da Google. È possibile cercare di capire cosa potrebbe essere cambiato guardando la versione precedente dei reclami e la versione più recente e vedendo cosa è stato rimosso e cosa è stato aggiunto. Una cosa che mi è subito saltata all'occhio sono state queste righe della nuova versione delle affermazioni:
4. Il metodo della rivendicazione 1, dove le informazioni sono fornite in un documento dei risultati della ricerca, e il metodo include: posizionare, nel documento dei risultati della ricerca, le informazioni basate su un rispettivo punteggio per ciascun repository dei più di una pluralità di repository.
5. Metodo secondo la rivendicazione 1, comprendente inoltre: generare il modello basato su informazioni associate ai dati di registro, le informazioni associate ai dati di registro essendo formate in triple.
Ho pensato che la parte della descrizione del brevetto che discuteva i dati del log delle query, presentati come triple di dati per prevedere quali informazioni si desideravano da quali repository quando si cercava una determinata query, fosse interessante quando l'ho letto nel 2007. Sembra che la versione più recente delle affermazioni si concentra sull'analisi dei dati dell'utente per prevedere quali informazioni da quale repository mostrare ai ricercatori.
Questa versione più recente del brevetto è su:
Determinazione di un repository desiderato per il recupero dei risultati della ricerca
Inventori: Michael Angelo, David Braginsky, Jeremy Ginsberg e Simon Tong
Assegnatario: GOOGLE
Brevetto USA 9,639,579
Concesso: 2 maggio 2017
Archiviato: 27 luglio 2015
Astratto
Un sistema riceve una query di ricerca da un utente e ricerca un gruppo di repository, in base alla query di ricerca, per identificare, per ciascuno dei repository, un insieme di risultati di ricerca. Il sistema identifica anche uno dei repository in base alla probabilità che l'utente desideri informazioni dal repository identificato e presenta l'insieme dei risultati della ricerca associati al repository identificato.
Asporto
Con questo aggiornamento a questo brevetto, sembra che Google stia probabilmente utilizzando il tipo di dati utente che ho indicato nei casi di clic che ho descritto nel mio primo articolo su questo brevetto nel 2007, che è iniziato con questi elementi:
- Il paese in cui si trova l'utente,
- La lingua del paese in cui si trova l'utente,
- Un identificatore di cookie associato all'utente u,
- Il linguaggio di interrogazione q,
- Ogni termine in query q,
- L'ora del giorno che l'utente u ha fornito alla query q, i documenti dal repository r che sono stati presentati all'utente u,
Questo è solo l'inizio del tipo di dati che Google potrebbe raccogliere per costruire un modello di previsione con cui decidere da quale repository mostrare le informazioni nella parte superiore dei risultati di ricerca.
