Domanda Rispondere Spiegare Stime di Fatti Mancanti
Pubblicato: 2019-06-19Google inizierà a spiegare le stime nei risultati di ricerca?
Abbiamo riscontrato un aumento del numero di risposte che Google mostra per le domande poste dagli utenti nella casella di ricerca di Google. E Google ha rilasciato dichiarazioni sul voler rispondere a tali domande, di cui ho scritto in Quando Google ha iniziato a mostrare risposte dirette, che indica un post sul blog di Google del 2005 e nel 2011 ha concesso a Google Patente di rispondere a domande sui fatti in risposta alle domande.
In un rendiconto finanziario di Alphabet 2017, ci è stato detto che Google voleva iniziare a rispondere alle domande senza richiedere che gli utenti esaminassero una serie di documenti per trovare le risposte a tali domande:
Invece di mostrare solo dieci link blu nei nostri risultati di ricerca, siamo sempre più in grado di fornire risposte dirette, anche se stai pronunciando la tua domanda utilizzando Ricerca vocale, il che rende più veloce, più facile e più naturale trovare ciò che stai cercando .
Ci sono momenti in cui le fonti di una risposta a tali domande possono mancare entità poste o contenere fatti errati su alcune entità. Un brevetto di Google appena concesso ci parla di un problema che esiste con alcune fonti di dati che può impedirgli di rispondere alle domande utilizzando tali fonti:
I modelli relazionali della conoscenza, come un archivio dati basato su grafici, possono essere utilizzati per fornire risposte alle query di ricerca. Tali modelli descrivono entità del mondo reale (persone, luoghi, cose) e fatti su queste entità sotto forma di nodi del grafo e bordi tra i nodi. Sebbene tali grafici possano rappresentare una quantità significativa di fatti, anche ai grafici più grandi potrebbero mancare decine di milioni di entità o potrebbero contenere fatti errati per alcune entità. Ad esempio, spesso possono mancare date o altri attributi per una determinata entità.
Il brevetto mira a risolvere tali problemi deducendo risposte basate su fatti correlati (fornendo stime spiegabili):
I fatti mancanti da un modello relazionale di conoscenza spesso possono essere dedotti sulla base di altri fatti correlati nel grafico. Ad esempio, un sistema di ricerca può scoprire che nel 70% dei matrimoni il marito e la moglie hanno meno di 5 anni. Usando questa distribuzione, il sistema può stimare con alta sicurezza che un uomo la cui data di nascita è sconosciuta, ma la cui data di nascita della moglie è nota, è molto probabilmente entro 5 anni dall'età di sua moglie. Sebbene questo esempio utilizzi un elemento di prova a sostegno (chiamato caratteristica), l'età del coniuge, le stime di fatti mancanti o errati sono spesso più complesse e possono essere basate su diverse, anche centinaia, di tali caratteristiche. Alcune implementazioni forniscono un'interfaccia di ricerca che fornisce una stima per un fatto mancante e una spiegazione leggibile dall'uomo della base per la stima. Ad esempio, un sistema di ricerca può utilizzare la distribuzione congiunta di una pluralità di caratteristiche per generare una stima delle informazioni richieste da una query che non possono essere ottenute direttamente da un grafico di dati. Ogni caratteristica può rappresentare un fatto relativo alle informazioni mancanti. Il sistema può applicare una serie di misure contro le caratteristiche per determinare quali caratteristiche e combinazione di caratteristiche influenzano fortemente la stima e selezionare una piccola quantità delle caratteristiche per una spiegazione che viene mostrata al richiedente. Il numero di caratteristiche utilizzate nella spiegazione può dipendere dalla forza o dal tipo delle caratteristiche o dalla sua relazione non lineare con altre caratteristiche. In un'implementazione, il sistema può utilizzare modelli per fornire una spiegazione leggibile dall'uomo della stima.
Una stima per un fatto mancante sarebbe accompagnata da una spiegazione leggibile dall'uomo di una base per tale stima. Il brevetto indica l'uso di una distribuzione di probabilità congiunta per stimare alcuni fatti Questa spiegazione è incorporata nel processo alla base di questo brevetto e ci viene detto che sarebbe inclusa, insieme a una stima, come parte di un risultato di ricerca per una query. Quindi, quando una query riguarda l'età di un particolare uomo e la data di nascita di sua moglie è nota, possiamo ricevere una stima della sua data di nascita basata sulla sua data di nascita:
In un aspetto, un sistema informatico include almeno un processore e una memoria che memorizza un grafico di dati e istruzioni che, quando eseguite dall'almeno un processore, fanno sì che il sistema riceva una query che richiede informazioni per una prima entità e generano una stima per le informazioni richieste utilizzando informazioni note dal grafico dei dati per le seconde entità relative alla prima entità nel grafico dei dati. Le istruzioni possono anche includere istruzioni che fanno sì che il sistema generi, dalle informazioni note utilizzate per determinare la stima, una spiegazione della stima basata sulle informazioni note ritenute influenti per la stima e fornisca la spiegazione e la stima come parte di un risultato della ricerca per la query. Ad esempio, quando la prima entità è una persona, una seconda entità è il coniuge della persona, le informazioni note possono includere l'età o la data di nascita del coniuge.
Ci viene detto che quando tali stime vengono fornite ai ricercatori, tali risposte possono talvolta essere conservate nel grafico dei dati, in base a quanto influenti sono le informazioni note e un punteggio di contributo per tali informazioni.
Vantaggi di questo approccio esplicativo delle stime per i fatti mancanti
Il brevetto ci dice quali ritiene siano i vantaggi dell'utilizzo di questo processo.
Uno di questi è che spiegare le stime può dare agli utenti "un senso di comprensione della stima e una base per credere o non credere alla stima, che migliora l'esperienza di ricerca dell'utente".
Un altro è che fare stime basate su "caratteristiche influenti" e "caratteristiche che possono essere stimate da un modello di distribuzione congiunta", significa che questo sistema non si basa su "elenchi inseriti o mantenuti manualmente".
Il brevetto sulla spiegazione delle stime sui fatti è:
Fornire una spiegazione di una stima di fatto mancante
Inventori: Gal Chechik, Yaniv Leviathan, Ran El Manor, Yoav Tzur, Eyal Segalis, Efrat Farkash e Yossi Matias
Assegnatario: GOOGLE LLC
Brevetto USA: 10,318,540
Concesso: 11 giugno 2019
Archiviato: 29 dicembre 2016
Astratto
Vengono descritti sistemi e metodi per spiegare una stima per le informazioni mancanti da un grafico di dati. Un metodo di esempio può includere la ricezione di una query che richiede informazioni per una prima entità e la ricezione di una stima per le informazioni, la stima essendo basata su una pluralità di caratteristiche di un modello di distribuzione congiunta. Il metodo può includere la determinazione dei rispettivi punteggi di contributo per la pluralità di caratteristiche, la selezione di una quantità delle caratteristiche con i punteggi di contributo più alti, la generazione, utilizzando la quantità selezionata di caratteristiche, una spiegazione per la stima; e fornendo la spiegazione e la stima come parte di un risultato di ricerca per la query.
Altre informazioni mancanti
Il brevetto inizia con un esempio di date di nascita, ma copre anche altri tipi di informazioni. Può esaminare i record di ricerca per cercare di avere un'idea di ciò che le persone potrebbero aver richiesto in passato e di ciò che potrebbe mancare nel suo grafico dei dati.
In alcune implementazioni, i moduli possono includere un motore di previsione. Il motore di previsione determina che le informazioni richieste mancano dal grafico dei dati e può fornire una stima per le informazioni mancanti. Le informazioni richieste possono essere richieste in una query o possono essere determinate dal tipo di informazioni spesso richieste nelle query. Ad esempio, il motore di previsione può analizzare i record di ricerca per determinare quali tipi di informazioni i richiedenti query hanno spesso richiesto in passato (ad esempio, date di nascita, coniugi, date di uscita di canzoni o film, ecc.) e utilizzare queste informazioni per cercare questi fatti nel grafico dei dati. Naturalmente, il motore di previsione può includere anche altri metodi per trovare i fatti mancanti, ad esempio utilizzando un tipo di entità per determinare quali attributi hanno le entità del tipo di entità e cercare gli attributi mancanti per le entità del tipo di entità. Ad esempio, un'entità persona può avere una data di nascita, quindi il motore di previsione può cercare entità che sono persone a cui manca una data di nascita, ecc.
Funzioni aggiuntive Utilizzato per prevedere una data di nascita.
Il brevetto mostra altri tipi di informazioni che potrebbero essere utilizzate per spiegare le stime sulle date di nascita. Questi potrebbero includere:
- Età del coniuge della persona.
- Età del figlio della persona.
- Data di laurea.
Asporto
Non posso affermare di aver visto stime con spiegazioni di fatti che potrebbero mancare quando si pone una domanda come query e si aspetta una risposta testuale. Terrò d'occhio uno di questi. Mi aspetto di vedere Google spiegare le stime su cose diverse dalle semplici date di nascita.

