Risultati di ricerca del ranking di Google

Pubblicato: 2021-04-15

Come Google risponde alle query quando classifica i risultati di ricerca

Un brevetto di Google depositato nel 2019 e concesso nel 2021 esamina gli aspetti dei risultati di ricerca del ranking di Google (SERP).

Questo brevetto è assegnato a Google, che è nato come motore di ricerca BackRub fondato da Lawrence Page e Sergey Brin quando erano studenti laureati a Stanford, e Page ha depositato un brevetto da assegnare a Stanford, e successivamente concesso in licenza a Google su PageRank (dal nome lui e descrittivo di come agiva come una parte di un sistema di classificazione che era una parte indipendente dalla query di un sistema di classificazione per pagine basato su collegamenti che puntavano a quelle pagine.)

Il motore di ricerca classifica i risultati di ricerca nelle pagine utilizzando punteggi a livello di pagina e può applicare punteggi a livello di sito in base alla qualità.

Google non applica un punteggio di autorità di dominio come la metrica Moz DA perché alcuni siti sul Web sono sottodomini su siti come WordPress.com. Google non utilizza un punteggio di autorità di dominio per tutti i siti che compongono WordPress.com.

Google può applicare punteggi come i punteggi di qualità del sito in base ai siti, ma non a livello di dominio. Google non classifica le pagine nelle SERP utilizzando i punteggi DA e non l'hanno mai fatto.

Questo brevetto sottolinea che il motore di ricerca può restituire documenti pubblici e documenti accessibili privatamente a cui possono accedere solo le persone che hanno effettuato l'accesso al sistema o hanno concesso l'accesso a quelle pagine private.

Questo brevetto più moderno sulle classifiche di Google fa anche riferimento più volte alle entità nel brevetto, che era diventato parte di Google dopo il 2012 quando ha introdotto il Knowledge Graph e ha iniziato a incorporare informazioni sulle entità del mondo reale nei risultati di ricerca.

Valeva la pena dedicare del tempo a questo brevetto per esaminare il funzionamento di un moderno motore di ricerca e il ruolo che potrebbe svolgere nella vita di molte persone.

Come un motore di ricerca indicizza i contenuti e classifica i risultati di ricerca

Il brevetto inizia dicendoci che i motori di ricerca forniscono informazioni su vari documenti come:

  • pagine web
  • immagini
  • Documenti di testo
  • Contenuti multimediali
  • Altre comunicazioni elettroniche

In risposta a una query, Google classifica i risultati di ricerca restituendo una o più pagine o altri tipi di risultati in risposta a una query.

Tali pagine possono essere classificate in base alla pertinenza a una query o ad altri segnali di ranking, per i quali fornirà risultati di ricerca.

Questo brevetto ci parla delle funzionalità della pagina per le pagine che rispondono a una query e delle funzionalità di query per le caratteristiche di un risultato di ricerca che corrisponde alla pagina data che risponde a una query, per mostrare il risultato della ricerca con una caratteristica di presentazione specifica.

Questo brevetto usa spesso la frase "caratteristiche di presentazione" senza definire realmente cosa significano. Ad esempio, Google ha sviluppato molti modi unici per presentare le informazioni quando si classificano i risultati di ricerca per rispondere alle query. Il brevetto in realtà non definisce la maggior parte delle differenze tra un risultato di ricerca organico con un titolo, un URL e uno snippet che funge da riepilogo e altri modi di classificare i risultati della ricerca utilizzando risultati di map pack, definizioni, frammenti in primo piano, domande correlate , schede informative, mappe del sito e risultati di ricerca universali. Abbiamo scritto di molte di queste diverse presentazioni anche se non sono coperte da questo brevetto.

Google classifica i risultati di ricerca per l'accesso ai documenti con restrizioni

Uno degli argomenti trattati da questo brevetto è quello a cui si riferisce come "accesso ai documenti riservati". Ad esempio, Google consente a un utente di eseguire ricerche tra i contenuti associati al suo login utente su Google, come Gmail, o i contenuti associati a Google My Business, come i dati associati a un'azienda che possono assegnare a qualcuno il controllo sotto il loro log- in. Inoltre, una persona può visualizzare annotazioni di ricerca associate a dati pubblici o privati ​​associati all'utilizzo del motore di ricerca e accedere a documenti riservati.

Questo brevetto si concentra più sull'accesso a documenti riservati che su altri contenuti che potrebbero vedere perché potrebbero essere registrati nel motore di ricerca. Il focus del brevetto è sulla formattazione dei risultati di ricerca indipendentemente dal fatto che siano documenti pubblici o privati, e quindi copre entrambi. Inizia concentrandosi su documenti privati, ma copre principalmente i risultati della ricerca.

Alcune pagine su cui Google sta classificando i risultati di ricerca per rispondere a una query potrebbero avere accesso a documenti con restrizioni. Questi sarebbero accessibili solo al ricercatore che ha inviato la query e, facoltativamente, ad altri utenti designati da quell'utente.

Le misure delle note sui brevetti associate alle caratteristiche della pagina o alle caratteristiche delle query determinano una caratteristica di presentazione.

Tale misura si basa sulle interazioni passate degli utenti di altre pagine che condividono le funzionalità della pagina con la pagina specificata, in cui molte delle altre pagine sono ciascuna diversa dalla pagina specificata (e ciascuna diversa l'una dall'altra).

L'analisi di tali misure consente di sfruttare le interazioni passate con altre pagine per determinare la pertinenza basata sull'interazione di una determinata pagina, senza fare riferimento a eventuali interazioni passate basate su query dirette a una determinata pagina.

Le altre pagine possono includere o essere limitate a pagine che sono esse stesse ad accesso limitato.

In che modo Google classifica i risultati di ricerca utilizzando le funzioni dipendenti dalla query e indipendenti dalla query

Questo brevetto fa anche riferimento agli aspetti "Query Dependent" e "Query Independent" dei segnali di ranking che possono svolgere un ruolo nel modo in cui le pagine possono essere classificate quando un ricercatore inserisce una query in una casella di ricerca.

Quando a una pagina sono state collegate molte altre pagine, è considerata una pagina più importante nell'ambito dell'approccio PageRank. Un collegamento a una pagina è come una nota a piè di pagina su un foglio che punta alla fonte delle informazioni utilizzate in quella pagina. Più citazioni del genere e migliore è la fonte della citazione, più importante è considerata la pagina. Questo effetto dei collegamenti che puntano a una pagina è considerato indipendente dalla query perché viene utilizzato per creare un punteggio che è lo stesso indipendentemente dalla pertinenza del collegamento (e del suo testo di ancoraggio) alla pagina a cui è collegato. Questo punteggio PageRank indipendente dalla query viene combinato con un punteggio di pertinenza per classificare una pagina in risposta a una query.

Una funzione dipendente dalla query per una pagina si basa solitamente su un punteggio di recupero delle informazioni che esamina la pertinenza (e il significato) delle parole su una pagina e il testo di ancoraggio dei collegamenti che puntano a quella pagina. Vedrai che questo nuovo brevetto punta a funzionalità di query e funzionalità di documento in un sistema di ricerca e fa riferimento a funzionalità dipendenti dalla query e indipendenti dalla query. Per questi è importante determinare se la pertinenza (o il significato) fa la differenza.

Tornando al brevetto dei risultati di ricerca in classifica...

Per determinare una caratteristica di presentazione di un risultato di ricerca che corrisponda al fatto che una determinata pagina risponda a una query, viene generata una misura dipendente dalla query per la determinata pagina e utilizzata per determinare la caratteristica di presentazione.

Una misura dipendente dalla query può determinare un punteggio per una determinata pagina. Quindi, quel punteggio può essere utilizzato per classificare la pagina data rispetto ad altre pagine responsive per la query (ad esempio, in base ai loro punteggi corrispondenti, che possono anche essere basati su misure dipendenti dalla query corrispondenti).

Una misura dipendente dalla query può modificare un punteggio iniziale per la data pagina (ad esempio, un punteggio basato su un grado di corrispondenza tra la query e la data pagina). Il punteggio modificato viene utilizzato per classificare la pagina data rispetto ad altre pagine responsive per la query.

La classifica può determinare quali pagine responsive vengono utilizzate nel fornire risultati di ricerca corrispondenti per la presentazione in risposta alla query e/o per determinare un ordine di presentazione (o altre prominenze di visualizzazione) per i risultati della ricerca.

La misura dipendente dalla query per una determinata pagina che risponde a una query può essere decisa in base alle interazioni passate tra le funzionalità di query della query e le funzionalità di pagina di una determinata pagina.

Ciascuna delle misure può essere basata su diverse interazioni passate, da parte di utenti corrispondenti, con altre pagine aventi le caratteristiche della pagina quando le altre pagine sono state presentate in risposta a query corrispondenti aventi una o più delle caratteristiche della query.

Per determinare misure quali:

  • Selezioni dei risultati di ricerca per altre pagine in risposta alle query corrispondenti (ad es. una frazione di clic su osservato)
  • L'accesso alla pagina conta
  • Monitoraggio del cursore
  • Gesti tattili

Altre pagine possono includere o essere limitate per accedere a documenti riservati, come pagine non accessibili che sono ciascuna persona per uno degli altri ricercatori e non accessibili per il ricercatore.

Come Google classifica i risultati di ricerca utilizzando i segnali di ranking indipendenti dalle query

Una misura indipendente dalla query per una pagina può essere generata e utilizzata per determinare la caratteristica di presentazione. Lo farà indipendentemente dal fatto che sia rilevante per la query.

La misura indipendente dalla query può essere basata su interazioni passate, da parte di altri utenti, con altre pagine che possiedono caratteristiche della pagina specificata quando vengono mostrate le altre pagine in risposta a query corrispondenti che includono query senza funzionalità di query.

Questa funzionalità indipendente dalla query può indicare la popolarità delle pagine con le stesse funzionalità della pagina. La misura dipendente dalla query fornisce un segno della popolarità delle pagine con funzionalità di pagina in risposta a query con funzionalità di query.

Un metodo può mostrare la ricezione di una query inserita da un ricercatore tramite un dispositivo di input dell'interfaccia del ricercatore del dispositivo informatico dell'utente.

Il metodo può inoltre includere l'identificazione di pagine responsive che rispondono alla query, inclusa un'e-mail inviata a un indirizzo e-mail del ricercatore.

Il metodo include inoltre l'identificazione di una o più funzionalità di pagina per l'e-mail.

Le funzionalità della pagina includono almeno una funzionalità di posta elettronica basata su almeno una delle seguenti opzioni:

Dal contenuto, in base alla sua presenza in un "campo Da" dell'e-mail

Contenuto dell'oggetto, in base alla sua presenza in un "campo Oggetto" dell'e-mail.

Il metodo include inoltre l'identificazione delle caratteristiche per la query e la generazione di una misura dipendente dalla query per l'e-mail basata su misure di interazioni passate tra le caratteristiche della query e le caratteristiche della pagina, dove ciascuna delle misure si basa su interazioni passate, da parte degli utenti corrispondenti, con altri pagine con le caratteristiche della pagina quando le altre pagine sono state presentate in risposta a query corrispondenti aventi una o più delle caratteristiche della query.

Il metodo dei risultati di ricerca del ranking include inoltre:

Utilizzo della misura dipendente dalla query per l'e-mail per determinare una caratteristica di presentazione per presentare un risultato di ricerca dell'e-mail che corrisponde all'e-mail
Fornire, in risposta alla query, il risultato della ricerca e-mail per la presentazione con la caratteristica di presentazione.

Questo metodo e altre implementazioni tecnologiche qui divulgate possono includere una o più delle seguenti caratteristiche.

La funzione e-mail si basa sia sul contenuto del mittente nel campo del mittente che sul contenuto dell'oggetto nel campo dell'oggetto.

La funzione e-mail può essere una co-occorrenza del contenuto del mittente nel campo del mittente e del contenuto dell'oggetto nel campo dell'oggetto.

Il contenuto Da può includere un nome di dominio di un indirizzo e-mail del mittente dell'e-mail e/o il contenuto Oggetto può includere un modello che include uno o più termini e uno o più segnaposto.

Almeno una funzionalità di posta elettronica si basa sul contenuto dell'oggetto nel campo Oggetto e il contenuto dell'oggetto include un modello che include uno o più termini e uno o più segnaposto.

In alcune implementazioni, gli altri documenti su cui si basano le misure escludono l'e-mail.

Il metodo include inoltre:

Generazione di una misura indipendente dalla query per l'e-mail basata su più misure di interazioni passate aggiuntive con le funzionalità del documento in risposta a query aggiuntive che non hanno nessuna delle funzionalità di query
L'utilizzo della misura indipendente dalla query per l'e-mail per determinare la caratteristica di presentazione per presentare il risultato della ricerca dell'e-mail corrisponde all'e-mail.

L'utilizzo della misura dipendente dalla query per l'e-mail per determinare la caratteristica di presentazione comprende:

  • Determinazione di un punteggio per l'e-mail in base alla misura dipendente dalla query
  • Determinazione di punteggi aggiuntivi per altri documenti responsive
  • Classifica dell'email rispetto all'altro dei documenti responsive in base al punteggio e ai punteggi aggiuntivi
  • Determinazione della caratteristica di presentazione in base alla graduatoria.

Le caratteristiche del documento possono inoltre includere una categoria dell'e-mail. Il metodo può includere l'utilizzo di un modello di apprendimento automatico per determinare la categoria dell'e-mail.

Le interazioni passate con altri documenti aventi le caratteristiche del documento possono includere selezioni degli altri documenti.

Un metodo include la ricezione di una richiesta immessa da un utente tramite un dispositivo di input dell'interfaccia utente di un dispositivo informatico e l'identificazione di documenti responsivi che rispondono alla richiesta.

Il metodo di classificazione dei risultati della ricerca coinvolge inoltre le funzionalità di query per la query e, per ciascuno dei molti documenti ad accesso limitato:

  • Identificazione delle caratteristiche del documento per il documento ad accesso limitato
  • Generazione di una misura dipendente dalla query per il documento ad accesso limitato in base alle misure delle interazioni passate tra le caratteristiche della query e le caratteristiche del documento, dove ciascuna delle misure si basa su un numero delle interazioni passate, da parte degli utenti corrispondenti, con altri documenti che hanno il documento caratteristiche quando gli altri documenti sono stati presentati in risposta a query corrispondenti aventi caratteristiche di query e dove gli altri documenti possono includere molti documenti non accessibili che non sono accessibili all'utente

Il metodo include inoltre l'utilizzo delle misure dipendenti dalla query per i documenti con accesso limitato per determinare un ordine di presentazione per i documenti responsivi e fornire, in risposta alla query, uno o più dei documenti responsivi per la presentazione in base all'ordine di presentazione.

Questo metodo e altre implementazioni tecnologiche qui divulgate possono includere una o più delle seguenti caratteristiche.

Le caratteristiche del documento per il documento con accesso limitato possono comprendere un modello incluso in un campo particolare del documento con accesso limitato.

Gli altri documenti possono escludere uno o più documenti ad accesso riservato.

Gli altri documenti su cui si basa una determinata misura delle misure possono essere costituiti da documenti non accessibili che non sono accessibili all'utente.

Il metodo include inoltre: per ciascuno dei documenti ad accesso limitato, la generazione di una misura indipendente dall'interrogazione per il documento ad accesso limitato basata su più misurazioni di più interazioni passate con le caratteristiche del documento in risposta a più interrogazioni che non hanno nessuna delle caratteristiche di interrogazione; e inoltre utilizzando le misure indipendenti dalla query per i documenti ad accesso limitato per determinare l'ordine di presentazione per i documenti di risposta.

Un metodo può includere:

  • Ricezione di una query inserita da un utente tramite un dispositivo di input dell'interfaccia utente di un dispositivo informatico dell'utente
  • Identificazione di documenti responsive che rispondono alla query
  • Identificazione delle caratteristiche della query per la query

Il metodo include inoltre, per ciascuno di un numero di documenti:

  • Identificazione delle caratteristiche del documento per il documento
  • Generazione di una misura dipendente dalla query per il documento basata su misure delle interazioni passate tra le caratteristiche della query e le caratteristiche del documento, dove ciascuna delle misure si basa su una quantità delle interazioni passate, da parte degli utenti corrispondenti, con altri documenti che hanno caratteristiche del documento quando il altri documenti sono stati presentati in risposta a query corrispondenti aventi le caratteristiche di query e dove gli altri documenti includono molti documenti oltre al documento

Il metodo include inoltre l'utilizzo delle misure dipendenti dalla query per i documenti per determinare un ordine di presentazione per i documenti responsivi e fornire, in risposta alla query, uno o più dei documenti responsivi per la presentazione in base all'ordine di presentazione.

Questo metodo di classificazione dei risultati di ricerca può includere:

  • Selezione di diverse funzionalità del documento e selezione di alcune funzionalità di query.
  • La selezione di ciascuna delle funzionalità del documento include la selezione della funzionalità del documento in base alla sua presenza in documenti ad accesso limitato di almeno una quantità soglia di utenti
  • La selezione delle funzionalità di query include la selezione della funzionalità di query in base alla sua presenza nelle query con accesso limitato di almeno una quantità soglia di utenti
  • Le query ad accesso limitato sono quelle per le quali almeno uno dei documenti ad accesso limitato forniti in risposta

Il metodo include inoltre, per ciascuna delle diverse caratteristiche di query, tuple di caratteristiche del documento che includono ciascuna almeno una delle caratteristiche della query e almeno una delle caratteristiche del documento: generazione di una misura di interazione passata tra le caratteristiche della query e le caratteristiche del documento della query caratteristica, tupla delle caratteristiche del documento.

La generazione della misura dell'interazione passata si basa su molte interazioni passate con i documenti corrispondenti dei documenti ad accesso limitato quando i documenti corrispondenti sono stati presentati in risposta alle domande corrispondenti delle query ad accesso limitato, dove i documenti corrispondenti hanno le caratteristiche del documento della funzione di interrogazione, documento tupla di funzionalità e dove le query corrispondenti hanno la funzionalità di query della funzionalità di query, tupla di funzionalità di documento.

Il metodo include inoltre la memorizzazione, in uno o più supporti leggibili da computer, di ciascuna delle misure di interazione passate associate a una corrispondente caratteristica di interrogazione, tupla di caratteristiche del documento.

Questo metodo e altre implementazioni tecnologiche qui divulgate possono includere una o più delle seguenti caratteristiche.

Il metodo include inoltre:

  • Identificazione di un nuovo documento che risponde a una nuova query di un determinato utente e che include un nuovo gruppo di query delle funzionalità del documento
  • Generazione di una misura per il nuovo documento in base a un gruppo di misure di interazione passate

Il gruppo delle misure di interazione passate può essere basato sulle misure di interazione passate del gruppo in associazione con la funzione di query, tuple di caratteristiche del documento che includono ciascuna almeno una delle caratteristiche del documento del nuovo gruppo di query.

Il metodo include inoltre la fornitura del nuovo documento in risposta alla nuova query basata sulla misura.

Il gruppo delle misure di interazione passate viene ulteriormente selezionato in base alle misure di interazione passate del gruppo in associazione con la funzionalità di query, tuple di funzionalità del documento che includono ciascuna almeno una funzionalità di query della nuova query.

Il nuovo documento può essere omesso dai documenti ad accesso riservato utilizzati per generare le precedenti misure di interazione.

Un metodo può includere la selezione di diverse funzionalità del documento e la selezione di una pluralità di funzionalità di query.

Il metodo include inoltre, per ciascuna delle molte funzionalità di query, tuple di funzionalità del documento che includono ciascuna almeno una delle funzionalità di query e almeno una delle funzionalità del documento: generazione di una misura di interazione passata tra le funzionalità della query e le funzionalità del documento della query feature, tupla delle caratteristiche del documento, dove: la generazione della misura dell'interazione passata si basa su diverse interazioni passate con i documenti corrispondenti quando i documenti corrispondenti sono stati presentati in risposta alle query corrispondenti; i documenti corrispondenti hanno le caratteristiche del documento della caratteristica query, tupla delle caratteristiche del documento; e le query corrispondenti hanno la funzionalità di query della funzionalità di query, tupla di funzionalità del documento.

Il metodo include inoltre la memorizzazione, in uno o più supporti leggibili da computer, di ciascuna delle misure di interazione passate associate a una corrispondente caratteristica di interrogazione, tupla di caratteristiche del documento.

Altre implementazioni possono includere uno o più supporti di memorizzazione leggibili da computer non transitori che memorizzano istruzioni eseguibili da uno o più processori per eseguire un metodo come uno o più dei metodi descritti nella presente.

Ancora un'altra implementazione può includere un sistema comprendente memoria e uno o più processori utilizzabili per eseguire istruzioni memorizzate nella memoria, per eseguire un metodo come uno o più dei metodi qui descritti.

Tutte le combinazioni dei concetti precedenti e dei concetti aggiuntivi descritti sui risultati di ricerca del ranking sono considerate parte dell'oggetto divulgato nel presente documento.

Il metodo include inoltre la memorizzazione, in uno o più supporti leggibili da computer, di ciascuna delle misure di interazione passate associate a una corrispondente caratteristica di interrogazione, tupla di caratteristiche del documento.

Questo metodo e altre implementazioni tecnologiche qui divulgate possono includere una o più delle seguenti caratteristiche.

In alcune implementazioni, il metodo di classificazione dei risultati di ricerca include inoltre:

  • Identificazione di un nuovo documento che risponde a una nuova query di un determinato utente e che include un nuovo gruppo di query delle funzionalità del documento
  • Generazione di una misura per il nuovo documento in base a un gruppo di misure di interazione passate

Il gruppo delle misure di interazione passate può essere selezionato in base alle misure di interazione passate del gruppo che viene memorizzato in associazione con la funzione di query, tuple di caratteristiche del documento che includono ciascuna almeno una delle caratteristiche del documento del nuovo gruppo di query.

Il metodo include inoltre la fornitura del nuovo documento in risposta alla nuova query basata sulla misura.

Il gruppo delle misure di interazione passate può inoltre essere selezionato in base alle misure di interazione passate del gruppo che viene memorizzato in associazione con la funzione di query, tuple di caratteristiche del documento che includono ciascuna almeno una caratteristica di query della nuova query.

Il nuovo documento può essere omesso dai documenti ad accesso riservato utilizzati nella generazione delle precedenti misure di interazione.

Può essere fornito un metodo, inclusa la selezione di una pluralità di caratteristiche del documento e la selezione di una pluralità di caratteristiche di interrogazione.

Il metodo può inoltre includere, per ciascuna delle molte funzionalità di query, tuple di funzionalità del documento che includono ciascuna almeno una delle funzionalità di query e almeno una delle funzionalità del documento: generare una misura di interazione passata tra le funzionalità di query e le caratteristiche del documento del caratteristica di query, tupla di caratteristiche del documento, dove: la generazione della misura dell'interazione passata si basa su molte interazioni passate con i documenti corrispondenti quando i documenti corrispondenti sono stati presentati in risposta alle query corrispondenti; i documenti corrispondenti hanno le caratteristiche del documento della caratteristica query, tupla delle caratteristiche del documento; e le query corrispondenti hanno la funzionalità di query della funzionalità di query, tupla di funzionalità del documento.

Il metodo includerebbe inoltre la memorizzazione, in uno o più supporti leggibili da computer, di ciascuna delle misure di interazione passate in associazione con una corrispondente caratteristica di interrogazione, tupla di caratteristiche del documento.

Altre implementazioni possono includere uno o più supporti di memorizzazione leggibili da computer non transitori che memorizzano istruzioni eseguibili da uno o più processori per eseguire un metodo come uno o più dei metodi descritti nella presente.

Ancora un'altra implementazione può includere un sistema comprendente memoria e uno o più processori utilizzabili per eseguire istruzioni memorizzate nella memoria, per eseguire un metodo come uno o più dei metodi qui descritti.

Tutte le combinazioni dei concetti precedenti e dei concetti aggiuntivi qui descritti in maggiore dettaglio sono considerate parte dell'oggetto qui divulgato.
Ad esempio, tutte le combinazioni dell'oggetto rivendicato che compaiono alla fine di questa divulgazione sono considerate parte dell'oggetto qui divulgato.

Questo brevetto su come Google classifica i risultati di ricerca si trova su:

Classificazione dei documenti dei risultati di ricerca
Inventori: Mike Bendersky, Marc Alexander Najork, Donald Metzler e Xuanhui Wang
Assegnatario: GOOGLE LLC
Brevetto USA: 10,970.293
Concesso: 6 aprile 2021
Archiviato: 26 agosto 2019

Astratto

Metodi e apparati relativi all'utilizzo di caratteristiche del documento di un documento che risponde a una query e facoltativamente funzionalità di query della query, per determinare una caratteristica di presentazione per presentare un risultato di ricerca che corrisponda al documento.

Le misure associate alle caratteristiche del documento e/o alle caratteristiche della query possono essere utilizzate per determinare la caratteristica di presentazione.

Le misure possono essere basate su interazioni passate, da parte di utenti corrispondenti, con altri documenti che condividono una o più caratteristiche del documento. A—– la pluralità degli altri documenti è diversa dal documento (e facoltativamente e, ciascuno diverso dall'altro).

In alcune implementazioni, il documento e/o gli altri documenti includono o sono limitati a documenti il ​​cui accesso è limitato.

Classifica dei risultati di ricerca dei documenti con accesso limitato

Il brevetto ci dice che alcuni processi per classificare i risultati della ricerca dal brevetto possono essere applicabili per accedere a documenti riservati. Ciò significherebbe documenti che un ricercatore potrebbe essere stato in grado di cercare, come le proprie e-mail.

Ci viene anche detto di quei "documenti ad accesso limitato" che possono essere contrapposti a documenti pubblicamente accessibili, che sarebbero liberamente accessibili al pubblico tramite il World Wide Web. Non siamo documenti elettronici accessibili a un gruppo ristretto di utenti.

L'accesso ai documenti riservati può essere limitato per un gruppo ristretto di utenti in base alle credenziali di accesso del gruppo ristretto di utenti e il documento con accesso riservato è accessibile tramite una rete privata accessibile solo al gruppo ristretto di utenti e/o basato su altre tecniche.

Questi "documenti ad accesso riservato di un utente" sono ad accesso riservato e accessibili solo all'utente e facoltativamente a un gruppo ristretto di uno o più altri utenti che possono essere designati o altrimenti controllati dall'utente.

Un documento ad accesso riservato di un utente può essere accessibile solo all'utente in funzione di:

  • Essere archiviati localmente su un dispositivo informatico controllato dall'utente
  • Essere accessibili tramite una o più applicazioni informatiche tramite apposite credenziali di accesso dell'utente, ecc.

Ad esempio, le e-mail dell'utente possono accedere a documenti riservati dell'utente accesso solo all'utente tramite le credenziali di accesso appropriate dell'utente.

Inoltre, documenti eterogenei di un utente archiviati in un sistema di archiviazione basato su cloud possono accedere a documenti riservati dell'utente accessibili solo all'utente tramite le credenziali di accesso appropriate dell'utente.

Facoltativamente, uno o più dei documenti eterogenei possono essere accessibili anche ad un gruppo ristretto di altri utenti sulla base di un'esplicita autorizzazione da parte dell'utente tramite una o più applicazioni informatiche. Ad esempio, documenti condivisi su un programma come Google Documents.)

Ci viene anche detto che vari documenti archiviati localmente su un telefono cellulare, tablet, desktop e/o altri dispositivi informatici di un utente possono avere accesso limitato a documenti dell'utente a causa dell'archiviazione locale sui dispositivi informatici dell'utente.

Dati di interazione dell'utente utilizzati nella classifica dei risultati di ricerca

Il brevetto ci parla anche dei dati di interazione dell'utente (ad esempio, la percentuale di clic) utilizzati per classificare particolari documenti dei risultati di ricerca pubblicamente accessibili per particolari query.

Questi dati sull'interazione dell'utente possono indicare che per una particolare query di ricerca, un particolare documento risultato di ricerca pubblicamente accessibile che risponde alla particolare query di ricerca ha una percentuale di clic per quella particolare query di ricerca che supera di gran lunga quella di qualsiasi altro documento risultato di ricerca pubblicamente accessibile che rispondono alla particolare query di ricerca.

Sulla base di tale indicazione, un risultato di ricerca corrispondente al particolare documento di risultato di ricerca accessibile pubblicamente può essere classificato in modo più evidente (ad esempio, fornito per la presentazione in modo più evidente), per la particolare query di ricerca, rispetto ai risultati di ricerca per gli altri documenti di risultato di ricerca accessibili pubblicamente. .

Alcuni dati di interazione dell'utente potrebbero non essere utilizzati nella classifica dei risultati di ricerca per i dati ad accesso limitato

Il brevetto ci dice quindi che alcune tecniche relative all'utilizzo dei dati di interazione dell'utente per classificare i risultati di ricerca accessibili pubblicamente per particolari query potrebbero non essere applicabili a vari documenti e/o potrebbero non fornire le prestazioni desiderate.

Varie tecniche potrebbero non essere applicabili a vari documenti ad accesso limitato (ad esempio, accesso a documenti riservati di un utente che invia una query) e/o a vari documenti pubblicamente accessibili (ad esempio, documenti accessibili al pubblico senza e/o relativamente poche interazioni in risposta alle query) .

Supponiamo che qualcuno invii una query di ricerca per cercare la propria email personale e che diverse email responsive (che sono documenti ad accesso limitato dell'utente) vengano restituite come rispondenti alla query di ricerca (ad esempio, le email includono uno o più termini che corrispondono a uno o più termini della query di ricerca).

Una o più e-mail di risposta potrebbero non essere mai state presentate e/o con cui hanno interagito in risposta a ricerche precedenti di altri utenti e/o dell'utente.

Una particolare email potrebbe essere stata inviata solo all'utente e forse una con la quale l'utente non ha mai interagito in precedenza in risposta a una query di ricerca precedente.

Pertanto, potrebbero non esserci dati di interazione dell'utente associati a una particolare e-mail, rendendo inefficaci le varie tecniche relative all'utilizzo dei dati di interazione dell'utente per classificare i risultati di ricerca pubblicamente accessibili nel classificare la particolare e-mail.

Come altro esempio, supponiamo che un ricercatore invii una query per cercare un corpus di documenti ad accesso limitato accessibili a un gruppo ristretto di utenti. Di nuovo, una pluralità di documenti responsivi viene identificata come rispondente alla query di ricerca.

Uno o più documenti di risposta potrebbero non essere mai stati presentati e/o con cui hanno interagito in risposta a precedenti invii della query di ricerca e/o potrebbero essere stati presentati e/o interagiti con solo un importo de minimis precedenti invii della query di ricerca.

Potrebbero non esserci sufficienti dati di interazione del ricercatore associati a tali pagine in risposta alla query di ricerca, rendendo inefficaci nel classificare tali documenti varie tecniche relative all'utilizzo dei dati di interazione dell'utente per classificare i risultati di ricerca pubblicamente accessibili.

Un altro esempio è supporre che qualcuno invii una query di ricerca per cercare un corpus di documenti pubblicamente accessibili. Di nuovo, una pluralità di documenti responsivi viene identificata come rispondente alla query di ricerca.

I documenti di risposta potrebbero non essere mai stati presentati e/o con cui hanno interagito in risposta a precedenti invii della query di ricerca e/o potrebbero essere stati presentati e/o interagiti solo con una quantità de minimis in risposta a precedenti invii della query di ricerca.

Pertanto, potrebbero non esserci sufficienti dati sull'interazione dell'utente associati a tali documenti in risposta alla query di ricerca, relativi all'utilizzo dei dati sull'interazione dell'utente per classificare i risultati di ricerca pubblicamente accessibili, inefficaci per classificare tali documenti.

Questo brevetto presenta varie caratteristiche tecniche relative all'utilizzo delle caratteristiche del documento di un documento che risponde a una query e, facoltativamente, le caratteristiche della query della query, per determinare una caratteristica di presentazione per presentare un risultato di ricerca che corrisponda al documento e, in risposta a la query, fornendo il risultato della ricerca per la presentazione con la caratteristica di presentazione.

Le misure associate alla caratteristica del documento) e/o le caratteristiche della query possono essere utilizzate per determinare la caratteristica di presentazione.

Tali misure possono essere basate su interazioni passate, da precedenti utenti di ricerche, con altri documenti che condividono le caratteristiche del documento con il documento. Many other documents are different from the document (and optionally, each different from one another).

Using such measures enables those past interactions to be leveraged in determining interaction-based relevance of the access restricted document, optionally without reference to any past interactions that are specifically directed to the access restricted document.

The other documents can include or are restricted to documents that are themselves access restricted.

In determining a presentation characteristic of a search result corresponding to a responsive document, a query-dependent measure for the access restricted document is generated and used to determine the presentation characteristic.

The query dependent measure can be based on past interactions between query features of the query and document features of the document.

Each of the measures may be based on a quantity of the past interactions, by previous searchers, with other documents having one or more of the document features when the other documents were presented in response to corresponding queries having one or more of the query features.

For example, assume a searcher uses an email search interface to submit a “book order number.”

A corpus of the searcher's emails that access restricted documents of the user may be searched, and a plurality of responsive emails is identified as responsive to the query.

A particular responsive email may be from “[email protected],” may include a subject of “Confirmation of Order 1A2B3C”, and may include a body with content that identifies a particular book purchased by the user, along with details of the purchase (eg, date of purchase, shipping address, delivery date, cost).

The particular responsive email may have never been interacted with by other users in response to queries of the other users (ie, since it is personal to the user and not accessible to the other users)–and may have potentially never even been interacted with by the user in response to a query of the user. However, techniques described there may still be used to determine a query-dependent measure for the particular email based on past interactions between query features of the query “book order number” and document features of the particular email.

For example, the first measure of past interactions may be determined based on several interactions of multiple users with other emails that include “[email protected]” in a From field and “Confirmation of Order [#]” (where [#] is a placeholder indicating an alpha and/or numeric string) in a Subject field, when those other emails were presented in response to corresponding queries having n-grams of “book order.”

Also, for example, the second measure of interactions may be determined based on many interactions of multiple users with other emails that include “[email protected]” in a From field and “Confirmation of Order [#]” in a Subject field, when those other emails were presented in response to corresponding queries having n-grams of “order number.”

The query dependent measure may be generated based on the first measure, the second measure, and optionally other similarly determined measures.

The query dependent measure may be a sum, average, median, or other statistical combination of the measures.

The query-dependent measure may be used to determine a presentation characteristic for the particular responsive email.

The query dependent measure may be utilized to modify an initial score for the particular responsive email (eg, a score based on a degree of matching between the query and the particular email), and the score utilized to rank the particular email relative to other responsive emails (eg, based on optionally modified initial scores for those emails).

The ranking may be used to determine which responsive emails are initially used to provide corresponding search results for presentation in response to the query, to determine a presentation order (or other display prominences) for the search results, and/or to determine additional or alternative presentation characteristics for search results.

Query Independent Measures to Rank Search Results

A query independent measure for the document is generated and could be used to determine the presentation characteristic.

The query independent measure could be based on measures of past interactions, by previous searchers, with other documents having one or more of the document features of the document when the other documents were presented in response to corresponding queries, where those queries include or are restricted to, those that do not include any of the query features.

The query independent measure may indicate the overall popularity of documents having the document features. The query dependent measure indicates the popularity of documents having the document features in response to queries having the query features.

A query dependent measure or a query independent measure of a document may be generated based on a query feature document feature model.

The query feature document feature model may be generated based on a query-document model, a document-feature model, and/or a query-feature model.

The query-document model may be a bipartite graph that models the interactions between queries and documents, as indicated by one or more stored records of past queries and corresponding interactions.

The nodes of the query-document graph may indicate queries and documents.

The edges may be between query and document nodes. They may each represent whether the corresponding document was observed for the corresponding query (eg, a corresponding search result presented in response to the corresponding query) and/or whether the document was interacted with (eg, selection of a corresponding search result) for the corresponding query.

The document-feature model may be a bipartite graph that models the relationship between documents and their document features.

Various features may be utilized, such as category features, structural features, and/or n-gram features.

The category features of a document may indicate categories to which the document belongs and may be based on applying features of the document to a classifier or other machine learning model and determining the category features based on the output generated over the machine learning model.

As an example of categories, emails may belong to finance, travel, order confirmation, and/or other categories.

Structural features may indicate templates and/or other contents of particular structural fields of documents.

For emails or other electronic communications, structural features may include:

  • From content included in a From field of the electronic communication (eg, a domain name of a sender's email address, a relationship of the sender to the user)
  • Subject content included in a Subject field of the electronic communication (eg, a particular template to which the Subject field conforms such as “Confirmation of Order [#]”)
  • A co-occurrence of particular From content and particular Subject content (ie, the From Content and the Subject Content both occurring in their respective fields)

Also, for example, structural features of an access restricted document may include a file type feature that is based on a file extension of the access restricted document.

Other structural features may include content, such as template(s) and/or n-grams that appear in one or more particular additional and/or alternative fields of a document, such as in a title field of a document; in a title, location, and/or notes field of a calendar entry document; eccetera.

The query-feature model may be a bipartite graph that models the relationship between queries and their query features.

The query features of a query may include:

  • N-grams appearing in the query (eg, the longest n-gram appearing in the query)
  • Entities referenced in the query (eg, a particular person, place, and/or thing)
  • Entity categories referenced in the query (eg, city, person's name, location, restaurant)
  • Grammatical features of the query, etc.

The query feature–document feature model may be a bipartite graph generated using the query-document graph, the document-feature graph, and the query-feature graph.

The query feature–document feature model can model the interactions between document features and query features.

In other words, it can model interactions between document and query features instead of interactions directly between queries and documents.

It is generated based on transforming the query-document model to the “document features” and “query features” space collectively modeled by the document-feature and query-feature models.

Only features (query or document) present in at least a threshold number of times (in queries or documents) and/or for at least a threshold number of searchers may be used in generating the query-feature, document-feature, and/or the query feature–document feature graphs.

This may ensure features do not include sensitive information by ensuring those features occur at least a threshold number of times and/or for at least a threshold number of users.

The query feature–document feature model may be used to determine, for a given document, a query independent measure and/or query dependent measure for the given document.

This may be done to determine a query-dependent measure for a given query. For example, having given query features, edges between the given query features and document features of the given document may be determined.

Each of the edges provides a measure of past interactions between a corresponding query feature and a corresponding document feature.

The measures may be combined (eg, summed and/or other statistical combinations) to determine the query dependent measure.

Also, to determine a query independent measure for the given document, edges between all query features and document features may be determined.

The measures may be combined (eg, summed and/or other statistical combinations) to determine the query independent measure.

Where Techniques Disclosed in the Ranking Search Results patent may be used

This example environment can include:

  • A client device
  • A search system
  • A past interaction measures system
  • A document measure system

The example environment also includes the personal corpora of a searcher of the client device.

The personal corpora may be stored on one or more corresponding non-transitory computer-readable media, which may be on the client device and/or remote from the client device (eg, on one or more remote servers).

The personal corpora may each store one or more access restricted documents of the user such as electronic communications of the user (eg, emails, SMS messages, chat messages, social networking messages), media files (eg, audio files, image files, video files), word processing documents, calendar entries, contact entries, etc.

The example environment also includes a query-document model stored on one or more non-transitory computer-readable media.

The query-document model may be a bipartite graph that models the interactions between queries and documents (including, or restricted to, access restricted documents), as indicated by one or more stored records of past queries and corresponding interactions.

For example, the query-document model may be generated based on records of past queries and corresponding interactions provided by the search system and/or other search systems based on interactions with the search system(s) by multiple users via multiple corresponding client devices.

The example environment further includes additional models generated by the past interaction measures system and utilized by the document measure system.

For example, the additional models may include at least a query feature–document feature model.

A searcher of the client device can submit queries to the search system via one or more user interface input devices of the client device.

In response to a query from the client device, the search system searches the personal corpora to identify access restricted documents of the user that are responsive to the search query using conventional and/or other information retrieval techniques.

The personal corpora may include an index that indexes documents thereof based on one or more features, and the search system identifies responsive documents using the index.

The search system searches corpora that include, or are restricted to; access restricted documents that are not access restricted documents of the user and/or publicly accessible documents.

The search system ranks scores for the documents responsive to a search query using one or more ranking signals.

Each of the ranking signals provides information about the document itself and its relationship, and the search query.

The ranking search results approach which the ranking engine uses to calculate scores for a document includes both a query dependent measure and/or a query independent measure that is generated by the document measure system according to the patent.

The ranking engine may use additional ranking signals, such as those indicating a degree of matching between the given document and the search query.

Ranking search signals for a document may be based on:

  • Whether each of one or more query terms appears in the document
  • Where each of one or more query terms appear in the document
  • The term frequency of each of one or more of the query terms that appear in the document
  • The document frequency of each of one or more of the query terms that appear in the document

The ranking engine then ranks the responsive documents using the scores.

The search system uses the responsive documents ranked by the ranking engine to generate search results to provide in response to the query.

The search results include search results corresponding to the documents responsive to the search query.

Ranking search results can include:

  • A title of a document
  • A link to a document
  • A summary of the document

The summary of the content may include a “snippet” or section of the document that is responsive to the search query.

For a search result associated with an image document, the search result may include:

  • A reduced size display of the image document
  • A title associated with the image document
  • A link to the image document

For a search results associated with a video, the search result may include:

  • An image from the video
  • A segment of the video
  • A title of the video
  • A link to the video

Other Search Results

Other search results include a summary of information responsive to the search query.

The summary is generated from documents responsive to the search query and/or from other sources.

Those search results are shown in a form enabling them to be presented to a searcher using searcher interface output devices on the client device.

How Ranking Search Results (SERPs) is Done

The document measure system may include:

  • A document features engine
  • A query features engine
  • A query dependent measure engine
  • A query independent measure engine

The patent tells us that various query features may be identified, such as:

  • N-grams appearing in the query
  • Entities referenced in the query
  • Entity categories referenced in the query
  • Grammatical features
  • Eccetera.

The query-dependent measure engine generates a query-dependent measure for each of the documents.

In determining a query dependent measure for a document, the query dependent measure engine determines past interaction measures that are assigned, in the model, to the query features and document features determined by engines.

For example, assume query features QF1 and QF2 for a query (where QF indicates a query feature) and document features DF1, DF2, and DF3 for an access restricted document responsive to the query (where DF indicates a document feature).

The query-dependent measure engine may determine a past interaction measure for each QF1 and DF1, QF1 and DF2, QF1 and DF3, QF2 and DF1, QF2 and DF2, and QF2 and DF3.

Il motore di misura dipendente dalla query può generare la misura dipendente dalla query per il documento con accesso limitato in base a una combinazione delle sei misure di interazione passate separate.

Ciascuna delle misure di interazione passate utilizzate dal motore di misura dipendente dalla query può essere basata su una quantità delle interazioni passate, da parte degli utenti corrispondenti, con altri documenti aventi una o più delle caratteristiche del documento quando gli altri documenti sono stati presentati in risposta alle query corrispondenti avere una o più caratteristiche della query.

Gli altri documenti stessi possono includere, o essere limitati a, una pluralità di documenti ad accesso limitato, come documenti non accessibili che sono ciascuno personale a un corrispondente degli altri utenti e che non sono accessibili all'utente. Di seguito viene fornita una descrizione aggiuntiva della generazione di misure di interazione passate.

Il motore di misura indipendente dalla query genera una misura indipendente dalla query per ciascuno dei documenti.

Nel determinare una misura indipendente dalla query per un documento, il motore della misura indipendente dalla query determina le misure di interazione passate che vengono assegnate, nel modello, a un gruppo di funzionalità di query e le funzionalità del documento determinate dal motore.

Il gruppo di funzionalità di query include o è limitato a funzionalità di query oltre a quelle determinate dal motore di funzionalità di query.

Di conseguenza, il gruppo di funzionalità di query è indipendente dalla query per la quale la pagina è reattiva. Include funzionalità di query che si aggiungono alle funzionalità di query della query. Ad esempio, supponiamo che le caratteristiche del documento DF1, DF2 e DF3 per un documento ad accesso limitato (dove DF indica una caratteristica del documento).

Il motore di misurazione indipendente dalla query può determinare:

  • Tutte le misure di interazione passate tra il gruppo di funzionalità di query e DF1
  • Tutte le misure di interazione passate tra il gruppo di funzionalità di query e DF2
  • Tutte le misure di interazione passate tra il gruppo di funzioni di query e DF3

Ad esempio, supponiamo che il gruppo di funzioni di query includa funzioni di query QF1-QF1000.

Per le interazioni passate di DF1, le misure possono essere determinate per QF1 e DF1, QF2 e DF1, QF3 e DF1, . . . e QF1000 e DF1.

Il motore di misura indipendente dalla query può generare la misura dipendente dalla query in base a misure di interazione passate.

Il sistema di misura del documento fornisce la misura dipendente dalla query e/o la misura indipendente dalla query per ciascuno dei sistemi di ricerca dei documenti.

Il motore di classificazione può utilizzare le misure dipendenti dalla query e/o le misure indipendenti dalla query per classificare i documenti e può utilizzare la classificazione per determinare un ordine di presentazione e/o altre caratteristiche di presentazione per i risultati della ricerca per i documenti.

Il motore di classificazione utilizza la misura dipendente dalla query e/o la misura indipendente dalla query per determinare un punteggio per il documento e utilizza il punteggio per classificare il documento.
Ad esempio, il motore di classificazione può modificare un punteggio di base per il documento (ad esempio, un punteggio di base basato su altri segnali di classificazione) a causa della misura dipendente dalla query e/o della misura indipendente dalla query per creare un punteggio modificato.

Ad esempio, supponiamo un punteggio base di sc.sub.b per un documento per una query.

Questo punteggio di base può essere basato sulla corrispondenza delle parole chiave e/o su altri segnali di posizionamento.

Il motore di classificazione può determinare un punteggio finale, sc.sub.f basato su f(sc.sub.b, M.sub.d, M.sub.q,d) dove M.sub.d rappresenta la misura dipendente dalla query per il documento e dove M.sub.q,d rappresenta la misura indipendente dalla query per il documento.

f() può essere facoltativamente un punteggio manuale o una funzione di classificazione appresa automaticamente.

In alcune implementazioni, il motore di classificazione mantiene fisso il punteggio di base (sc.sub.b) e addestra un .delta di regolazione (M.sub.d, M.sub.q,d) sul punteggio di base sc.sub. B.

La funzione di punteggio f( ) diventa quindi: f (sc.sub.b, M.sub.d, M.sub.q,d)=SC.sub.b+.delta.(M.sub.d, M.sub .q, d).

Questa formulazione adattiva può essere utile per ambienti in cui il punteggio di base è già altamente ottimizzato e facoltativamente disgiunto con le misure indipendenti dalla query e/o dipendenti dalla query.

Il sistema di misure di interazione passato può includere un motore di modello di query-documento, un motore di modello di funzionalità di documento, un motore di modello di funzionalità di query e/o un motore di modello di funzionalità di query-documento.

Tutti gli aspetti dei motori possono essere omessi, combinati e/o implementati separatamente dal precedente sistema di misure di interazione.

Il motore del modello di documento di query genera il modello di documento di query.

Il sistema di ricerca può implementare il motore modello query-document.

Il modello query-document può essere, ad esempio, un grafo bipartito che modella le interazioni tra query e documenti, come indicato da uno o più record archiviati di query passate e interazioni corrispondenti.

Ad esempio, i nodi del grafico query-document possono indicare query e documenti.

I bordi possono trovarsi tra i nodi della query e del documento. Ciascuno di essi può rappresentare, ad esempio, se il documento corrispondente è stato osservato per la query corrispondente (ad esempio, un risultato di ricerca corrispondente presentato in risposta alla query corrispondente) e/o se il documento è stato interagito con (ad esempio, la selezione di una ricerca corrispondente risultato) per la query corrispondente.

In alcune implementazioni, ciascuno degli archi può includere una rappresentazione binaria del fatto che si sia verificata un'interazione.

I bordi possono essere ponderati in base al tipo di interazione.

Una selezione di un risultato di ricerca seguita dall'accesso al documento sottostante per almeno una durata temporale soglia può essere ponderata più pesantemente rispetto a una selezione seguita dall'accesso del documento sottostante che non è per la durata temporale soglia, che può essere ponderata più pesantemente di un "passa il mouse" sul risultato della ricerca senza una selezione risultante.

Il modello di interrogazione-documento può essere rappresentato da una tripla (), dove l'insieme dei nodi di interrogazione che rappresentano le interrogazioni corrispondenti è l'insieme dei nodi di documento che rappresentano i documenti corrispondenti. Il set di bordi rappresenta i bordi che collegano i nodi della query e i nodi del documento.

Gli archi nell'insieme degli archi possono essere parametrizzati da tuple della forma e(q, d)=<.gamma..sub.o(q, d),.gamma..sub.c(q, d)>, dove q rappresenta un nodo di query connesso dall'edge, d rappresenta un nodo del documento connesso dall'edge e le funzioni di parametrizzazione .gamma..sub.o (a, b) e .gamma..sub.c(a, b) indicano che le entità a e b sono state osservate o cliccate nella stessa sessione di ricerca, rispettivamente.

In questa specifica, il termine "grafico" sarà utilizzato in senso lato per riferirsi a qualsiasi mappatura di una pluralità di elementi informativi associati.

Non è necessario che un grafico, o una parte di un grafico, sia presente in un singolo dispositivo di memorizzazione e può includere puntatori o altre indicazioni di elementi informativi che possono essere presenti su altri dispositivi di memorizzazione.
Ad esempio, un grafico può includere più nodi mappati tra loro. Ciascun nodo include un identificatore di un'entità o altro elemento informativo che può essere presente in un'altra struttura di dati e/o in un altro supporto di memorizzazione.

Il motore del modello di funzionalità del documento genera un modello di funzionalità del documento che può includere nei modelli.

Il motore del modello di funzionalità del documento può generare le funzionalità del documento in base ai documenti inclusi nel modello di query-documento.

Ad esempio, per ciascuno dei documenti del modello query-documento, il motore può identificare una o più caratteristiche del documento e definire una relazione tra il documento e le sue caratteristiche del documento. Il modello delle caratteristiche del documento può essere, ad esempio, un grafo bipartito che modella la relazione tra i documenti e le loro caratteristiche del documento.

Ad esempio, un primo nodo nel modello può rappresentare una caratteristica del documento. Tale nodo può essere connesso, mediante bordi corrispondenti, a ciascuno di una pluralità di nodi di documento che rappresentano ciascuno un documento corrispondente che include la caratteristica del documento.

I bordi possono indicare se una caratteristica corrispondente è presente in un documento corrispondente e, facoltativamente, un peso della caratteristica corrispondente per il documento corrispondente (ad esempio, per una caratteristica di categoria, il peso può indicare quanto fortemente il documento è associato alla categoria).

Varie funzioni possono essere utilizzate per classificare i risultati di ricerca, come ad esempio:

  • Caratteristiche della categoria
  • Caratteristiche strutturali
  • Caratteristiche di N-grammi

In alcune implementazioni, il modello delle caratteristiche del documento può essere rappresentato da una tripla (, A.sup.D, ), dove è l'insieme dei nodi del documento che rappresentano i documenti corrispondenti dove A.sup.D è l'insieme dei nodi delle caratteristiche del documento che rappresentano il insieme di caratteristiche del documento e l'insieme di bordi .epsilon..sup.D rappresenta i bordi che collegano i nodi del documento e i nodi della caratteristica del documento.

Gli archi nell'insieme di archi .epsilon..sup.D possono essere parametrizzati da e(d, a.sub.ij.sup.d), dove e(d, a.sub.ij.sup.d) indica se un la caratteristica corrispondente è presente in un documento corrispondente e, facoltativamente, un peso della caratteristica corrispondente per il documento corrispondente.

Il motore del modello di funzionalità di query genera un modello di funzionalità di query che può includere nei modelli.

Il motore del modello di funzionalità di query può generare le funzionalità per le query incluse nel modello di documento di query.

Ad esempio, per ciascuna delle query del modello query-documento, il motore può identificare una o più funzionalità di query e definire una relazione tra la query e le sue funzionalità di query.

Il modello delle funzionalità di query può essere, ad esempio, un grafo bipartito che modella la relazione tra le query e le relative funzionalità di query.

Ad esempio, un primo nodo nel modello può rappresentare una funzionalità di query. Tale nodo può essere connesso, mediante bordi corrispondenti, a ciascuno di una pluralità di nodi di query che rappresentano ciascuno una query corrispondente che include la funzionalità di query.

I bordi possono indicare se una caratteristica corrispondente è presente in una query corrispondente e facoltativamente un peso della caratteristica corrispondente per la query corrispondente.

Varie funzionalità possono essere utilizzate per classificare i risultati di ricerca, come ad esempio:

  • N-grammi che appaiono nella query
  • Entità a cui si fa riferimento nella query
  • Categorie di entità a cui si fa riferimento nella query
  • Caratteristiche grammaticali della query
  • Eccetera.

Il modello delle funzioni di query può essere rappresentato da una tripla (), dove l'insieme dei nodi di query rappresenta le query corrispondenti. Pertanto, l'insieme di funzionalità di query rappresenta l'insieme di funzionalità di query e l'insieme di bordi rappresenta i bordi che collegano i nodi di query e i nodi di funzionalità di query.

Gli archi nell'insieme degli archi possono essere parametrizzati da e(q, a.sub.kl.sup.q), dove e(q, a.sub.kl.sup.q) indica se una funzione di query corrispondente è presente in un query corrispondente e, facoltativamente, un peso della funzione corrispondente per la query corrispondente.

Il motore del modello di funzionalità di query–documento genera un modello di funzionalità di query–documento che può includere i modelli.

Il modello di funzionalità di query-documento può essere, ad esempio, un grafico bipartito generato utilizzando il grafico di query-documento, il grafico di funzionalità del documento e il grafico di funzionalità di query.

Il modello di funzionalità di query–caratteristiche del documento modella le interazioni tra le funzionalità del documento e le funzionalità di query.

In altre parole, modella le interazioni tra le funzionalità di documento e query anziché le interazioni direttamente tra query e documenti.

Viene generato in base alla trasformazione del modello di query-documento nello spazio "caratteristiche del documento" e "caratteristiche di query" modellate collettivamente dai modelli delle funzionalità del documento e delle funzionalità di query.

Il modello di funzionalità di query-documento può essere rappresentato da un triplo (, .epsilon..sup.A), dove è l'insieme di nodi di funzionalità di query che rappresentano l'insieme di funzionalità di query, A.sup.D è l'insieme di funzionalità di documento nodi che rappresentano l'insieme di attributi del documento e l'insieme di margini .epsilon..sup.A rappresenta i margini che collegano i nodi di funzionalità di query e i nodi di funzionalità di documento.

Ciascuno degli archi nel set di archi .epsilon..sup.A ha un peso o un'altra misura basata sul numero di interazioni passate tra la funzione di query del nodo di funzione di query corrispondente e la funzione di documento dei nodi di funzione di documento corrispondenti.

I bordi nel set di bordi .epsilon..sup.A possono essere parametrizzati da:

.funzione..funzione..tempi..funzione..tempi..funzione..gamma..funzione..g- amma..funzione. ##EQU00001## dove le funzioni del bordo e( ) sono definite come sopra.

Come si può apprezzare osservando la parametrizzazione degli archi sopra esposta, la parametrizzazione modella l'attributo query-documento osservato e le associazioni co-click tramite sommatoria su tutte le query e i documenti che possono essere associati ai rispettivi attributi.

In molte implementazioni, solo le funzionalità (query o documento) che sono presenti in almeno un numero soglia di volte (in query o documenti) e/o per almeno un numero soglia di utenti possono essere utilizzate nella generazione della funzione query, document -feature e/o i modelli di funzionalità di query-documento.

Ciò può garantire che i nodi di funzionalità non includano informazioni sensibili garantendo che le funzionalità di tali nodi di funzionalità si verifichino almeno un numero di soglia di volte e/o per almeno un numero di soglia di utenti.

Ciò può essere ottenuto rimuovendo, dal grafico delle caratteristiche del documento, tutti i nodi delle caratteristiche del documento che non hanno almeno un numero soglia di bordi che indicano la presenza nei documenti corrispondenti; e/o rimuovendo, dal modello di funzionalità di query, eventuali nodi di funzionalità di query che non hanno almeno un numero di soglia di bordi che indicano la presenza nelle query corrispondenti.

I nodi di funzionalità di query e/oi nodi di funzionalità di documento possono essere rimossi dal modello di funzionalità di query-documento utilizzando tecniche simili.

Il modello di funzionalità di query–document feature può essere utilizzato per determinare, per un dato documento, una misura indipendente dalla query e/o una misura dipendente dalla query per il documento dato.

Ad esempio, per determinare una misura dipendente dall'interrogazione per una data interrogazione avente determinate caratteristiche dell'interrogazione, possono essere determinati i bordi tra l'elemento o le caratteristiche dell'interrogazione data e le caratteristiche del documento del documento. Ciascuno dei bordi fornisce una misura delle interazioni passate tra una funzione di query corrispondente e una funzione del documento corrispondente.

Le misure possono essere combinate (ad esempio, sommate e/o altre combinazioni statistiche) per determinare la misura dipendente dalla query.

Inoltre, ad esempio, per determinare una misura indipendente dalla query per i dati bordi del documento tra un gruppo di funzionalità di query (che include o è limitato a funzionalità di query non incluse nelle caratteristiche di query date) e le caratteristiche del documento del documento possono essere determinate. Infine, le misure possono essere combinate (ad esempio, sommate e/o altre combinazioni statistiche) per determinare la misura indipendente dalla query.

Aggiunta di documenti provati a come Google classifica i risultati di ricerca

I documenti come le e-mail non vengono collegati come le pagine Web. Ma ci sono modi per determinare quale di questi documenti potrebbe essere più importante di altri indipendentemente dai termini di ricerca utilizzati per cercarli. Adattare quei documenti privati ​​al modo in cui il motore di ricerca di Google classifica i contenuti è un approccio adottato da questo brevetto.

Ci sono state molte modifiche al funzionamento della ricerca dall'avvio del motore di ricerca Google, incluso il modo in cui vengono restituiti i risultati di ricerca privati ​​e pubblici e l'analisi delle entità nelle query.