Dezambiguizarea intrărilor de căutare pe baza contextului introducerii

Publicat: 2018-05-15

„Hei Google; New York, New York!"

Google aude o interogare pentru „New York, New York”. Oferă indicații, redă un cântec Frank Sinatra sau arată rezultatele căutării în stil turistic? Probabil că depinde de contextul acelei interogări.

După cum ni se spune într-un brevet Google:

Intrările utilizatorului pot fi identificate ca ambigue din mai multe motive. În general, intrarea utilizatorului este identificată ca fiind ambiguă dacă sistemul o interpretează ca având mai mult de o semnificație probabilă intenționată, în absența încercărilor de dezambiguizare a intrării utilizând tehnicile descrise aici. De exemplu, în exemplul de față, intrarea utilizatorului este identificată ca fiind ambiguă pe baza fiecăreia dintre comenzile corespunzătoare posibile intrării – intrarea utilizatorului „Mergi la New York, New York” poate indica o locație geografică (orașul New York). York, NY), un cântec (melodia „New York, New York”) și o pagină web (o pagină web de turism pentru orașul New York, NY). Comenzile pot fi identificate ca fiind posibil corespunzătoare intrării utilizând oricare dintr-o varietate de tehnici, cum ar fi interogarea unei aplicații și/sau serviciu corespunzătoare fiecărei comenzi (de exemplu, interogarea unui player muzical asociat cu comanda „Mergi la [Cântec]” pentru a determina dacă „New York, New York” este o melodie accesibilă pe dispozitivul de calcul mobil), accesând unul sau mai multe grupuri de termeni permisi pentru fiecare comandă (de exemplu, accesarea unui grup de termeni de locație geografică admisibilă pentru comanda „Go To [ Localizare geografică]”), etc.

Dezambiguizarea intrărilor de căutare în funcție de contextul acelor interogări

Google a oferit input la interogările de căutare pentru a oferi răspunsuri clare la interogările de căutare. Acest brevet Google recent acordat analizează contextul interogărilor pentru a încerca să dezambiguizeze intrările utilizatorilor pentru a face rezultatele să nu fie ambigue.

După cum ne spune brevetul, acesta este scopul său:

În tehnicile descrise în acest document, contextul unui dispozitiv de calcul, cum ar fi un telefon mobil (de exemplu, un smartphone sau un telefon cu aplicație) este luat în considerare pentru a elimina ambiguitatea intrărilor utilizatorului. Intrarea ambiguă a utilizatorului este intrarea care, în absența informațiilor relevante de dezambiguizare, ar fi interpretată de dispozitivul de calcul sau pentru dispozitivul de calcul (de exemplu, de către un sistem server cu care dispozitivul de calcul este în comunicare electronică) ca fiind corespunzătoare la mai mult de o singură interogare sau comandă. Intrarea ambiguă poate fi deosebit de comună pentru intrarea vorbită, în parte din cauza prezenței homofonelor și în parte, pentru că un procesor de vorbire în text poate avea dificultăți în diferențierea cuvintelor care sunt pronunțate diferit, dar care sună similar între ele. De exemplu, dacă un utilizator spune „căutați informații despre vele/vânzare” la un dispozitiv de calcul mobil, această intrare vocală poate fi ambiguă, deoarece poate corespunde comenzii „căutare informații despre vele” (de exemplu, informații despre o velă pentru o barca cu pânze). ) sau la comanda „căutare informații despre vânzare” (informații privind o vânzare de mărfuri). Un dispozitiv ar putea chiar să determine că intrarea a fost „căutare informații despre vânzare”, deoarece „vânzarea” și „vânzarea” sună la fel, în special în anumite dialecte.

Cum ar putea funcționa această dezambiguizare a intrării de căutare?

Brevetul ne spune că intrarea ambiguă a utilizatorului poate fi dezambiguată pe baza unui context asociat cu un dispozitiv de calcul mobil (și/sau un utilizator al dispozitivului de calcul mobil) separat de intrarea utilizatorului în sine, cum ar fi:

  1. Locația fizică în care se află dispozitivul de calcul mobil (de exemplu, acasă, serviciu, mașină etc.)
  2. Mișcarea dispozitivului de calcul mobil (de exemplu, accelerație, staționare etc.)
  3. Activitate recentă pe dispozitivul de calcul mobil (de exemplu, activitate în rețeaua socială, e-mailuri trimise/primite, apeluri telefonice efectuate/primite etc.)

Exemplele de introducere a căutării care sunt dezambiguate pe baza contextului pot include

1. Un dispozitiv care este andocat poate determina tipul de andocare în care se află, cum ar fi prin contacte electrice fizice de pe dock și dispozitiv care se potrivesc între ele sau prin comunicare electronică (de exemplu, prin Bluetooth sau RFID) între dock și dispozitiv. Asta ar putea spune dacă este într-un context ca „în mașină” sau „acasă” pe baza unei astfel de determinare. Pentru ca,

…dispozitivul am dezambiguat apoi introducerea vocală, cum ar fi „direcții”, unde termenul ar putea fi interpretat ca direcții geografice (de exemplu, indicații de conducere) într-un context „în mașină” și indicații de utilizare (de exemplu, pentru gătit) în un mod „acasă”.

2. Într-un alt exemplu, primirea, la un dispozitiv de calcul mobil, a unei intrări de utilizator ambigue, care poate indica comenzi multiple, poate determina un context curent asociat cu dispozitivul de calcul mobil care poate indica unde este situat dispozitivul de calcul mobil. Acest lucru poate influența rezultatele oferite pe baza acelui context.

Avantajul dezambiguerii intrărilor de căutare bazate pe context

Brevetul ne spune despre avantajul de a urma procesele descrise în brevet ca fiind:

Permiterea utilizatorilor să instruiască un dispozitiv de calcul mobil să îndeplinească sarcina dorită fără a solicita utilizatorului să respecte toate formalitățile de furnizare a intrării pentru sarcina dorită. Pe măsură ce caracteristicile furnizate de un dispozitiv de calcul mobil au crescut, utilizatorilor li se poate cere să furnizeze intrarea lor cu o mai mare specificitate, astfel încât intrarea să fie asociată în mod corespunzător cu caracteristica dorită. Cu toate acestea, o astfel de specificitate poate fi greoaie și dificil de reținut. Metodele, sistemele, tehnicile și mecanismele descrise în acest document pot permite unui utilizator să furnizeze informații folosind mai puțină specificitate decât este necesar în mod formal pentru o caracteristică, dar totuși să acceseze caracteristica dorită.

Brevetul este:

Dezambiguizarea introducerii în funcție de context
Inventatori: John Nicholas Jitkoff și Michael J. LeBeau
Cesionar: Google LLC
Brevet SUA: 9.966.071
Acordat: 8 mai 2018
Depus: 1 iulie 2016

Abstract

Într-o implementare, o metodă implementată de calculator include primirea, la un dispozitiv de calcul mobil, a unei intrări de utilizator ambigue care indică mai mult de una dintr-o multitudine de comenzi; şi determinarea unui context curent asociat cu dispozitivul de calcul mobil care indică locul în care este situat dispozitivul de calcul mobil. Metoda poate include în plus dezambiguizarea intrării ambigue a utilizatorului prin selectarea unei comenzi din multitudinea de comenzi pe baza contextului curent asociat cu dispozitivul de calcul mobil și determinarea ieșirii asociate cu performanța comenzii selectate să fie furnizată de dispozitivul de calcul mobil. .

Am discutat cu un difuzor (dispozitiv) Google în această dimineață care a început cu un „Hei Google”, dar nu mi-a cerut să spun acea expresie fierbinte după ce Google a făcut unele modificări anunțate la recenta conferință Google I/O. Am cerut scoruri sportive, apoi am pus întrebări despre ele. Încă învăț cum să interacționez cel mai bine cu versiunea mea de difuzor a Google Now, dar este interesant. (Va fi util să spunem, vă rog, când cerem ceva?) Conversația mea de dimineață mi-a venit în minte când am început să citesc acest pasaj din acest brevet:

Acest document descrie tehnici, metode, sisteme și mecanisme pentru dezambiguizarea intrărilor ambigue ale utilizatorului pe un dispozitiv de calcul mobil (de exemplu, telefon cu funcții mobile, telefon inteligent (de exemplu, iPhone, BLACKBERRY), asistent digital personal (PDA), player media portabil (de ex. , iPod), etc.). Pe măsură ce caracteristicile oferite de dispozitivele de calcul mobile au crescut, numărul de comenzi recunoscute de un dispozitiv de calcul mobil poate crește, de asemenea. De exemplu, fiecare caracteristică de pe un dispozitiv de calcul mobil poate înregistra una sau mai multe comenzi corespunzătoare pe care un utilizator le poate tasta, vorbi, face gesturi etc. pentru a determina lansarea caracteristicii pe dispozitivul de calcul mobil. Cu toate acestea, pe măsură ce numărul de comenzi recunoscute crește, comenzile pot converge și pot face mai dificilă distingerea căreia dintre comenzile multiple este destinată să corespundă. Problema este amplificată pentru intrarea vocală. De exemplu, intrarea vocală care este furnizată cu zgomot de fond puternic poate fi dificil de interpretat cu acuratețe și, ca rezultat, poate fi mapată la mai mult de o comandă recunoscută de dispozitivul de calcul mobil. De exemplu, „exemplu” de intrare vocală ar putea fi interpretat ca, printre altele, „probă de ou”, „exemplu” sau „exam pull”. Ca un alt exemplu, comanda „go-to” poate reprezenta „mergi la [locația geografică]” pentru o aplicație de cartografiere și „mergi la [artist/album/melodie]” pentru un player media.

Pe măsură ce încercăm să învățăm cum să interacționăm cel mai bine cu dispozitivele și difuzoarele și dispozitivele mobile noastre pentru a obține cele mai bune rezultate de la Google, Google încearcă, de asemenea, să învețe cum să interacționeze cel mai bine cu noi și să se asigure că suntem înțeleși atunci când solicităm ceva. Acest brevet privind dezambiguizarea intrărilor de căutare face câțiva pași în această direcție. După cum ne spune:

Folosind tehnicile descrise aici, ca răspuns la primirea intrărilor ambigue ale utilizatorului, un context curent pentru dispozitivul mobil (și/sau un utilizator al dispozitivului de calcul mobil) poate fi determinat și utilizat pentru a dezambiguiza intrarea ambiguă a utilizatorului. Un context curent pentru un dispozitiv de calcul mobil poate include o varietate de informaţii asociate cu dispozitivul de calcul mobil şi/sau un utilizator al dispozitivului de calcul mobil. Contextul poate fi extern dispozitivului și reprezintă o stare în timp real în jurul dispozitivului, cum ar fi o locație fizică curentă (de exemplu, acasă, serviciu, mașină, situată în apropierea rețelei wireless „testnet2010” etc.), o direcție și o rată viteza cu care se deplasează dispozitivul (de exemplu, spre nord cu 20 mile pe oră), o locație geografică actuală (de exemplu, la colțul străzii 10 cu Marquette Avenue) și zgomotul ambiental (de exemplu, zumzet joasă, muzică, etc.). Contextul poate fi, de asemenea, intern dispozitivului, cum ar fi întâlnirile viitoare și/sau recente din calendar (de exemplu, întâlnirea cu John la 2:30 pm pe 29 iulie 2010), o oră și o dată pe un ceas din dispozitiv (de ex. , 2:00 pm pe 29 iulie 2010), activitatea recentă a dispozitivului (de exemplu, e-mailuri trimise lui John cu privire la întâlnirea de la 2:30) și imagini de la camerele dispozitivelor de calcul mobile.

Îmi folosesc adesea telefonul pentru a naviga în locuri și aș dori să pot vorbi cu telefonul meu, să fac modificări în locul în care navighez, cum ar fi dacă decid să trec cu mașina pe lângă destinația mea inițială pentru a merge mai întâi la un alt magazin, și aș dori să dezactivez navigarea pentru a nu-mi mai spune să fac o întoarcere pentru a reveni la prima destinație.

Acest brevet merită să-și petrec timpul pentru a fi examinat, deoarece prezintă câteva idei interesante despre ceea ce ar putea influența modul în care dispozitivele ar putea funcționa în funcție de context, așa cum ne spune aici:

Cu intrarea ambiguă a utilizatorului identificată, la pasul B poate fi determinat un context curent pentru dispozitivul mobil. Contextul curent include informații care descriu starea prezentă și/sau împrejurimile dispozitivului de calcul mobil și/sau utilizatorul dispozitivului de calcul mobil în momentul în care este primită intrarea. De exemplu, contextul actual poate include o varietate de informații legate de dispozitivul de calcul mobil și utilizator, cum ar fi informații privind mediul fizic înconjurător (de exemplu, rețele disponibile, conexiuni la alte dispozitive de calcul din apropiere, locație geografică, condiții meteorologice, afaceri, volumul zgomotului ambiental, nivelul luminii ambientale, imaginea captată de camera dispozitivului mobil etc.), starea actuală a dispozitivului de calcul mobil (de exemplu, rata de viteză, intrarea ecranului tactil activată, intrarea audio activată, soneria pornit/oprit etc.), informații despre oră și dată (de exemplu, ora din zi, data, întâlnirile din calendar, ziua săptămânii etc.), activitatea utilizatorului (de exemplu, activitatea recentă a utilizatorului, activitatea obișnuită a utilizatorului), etc. contextul curent poate fi determinat de dispozitivul de calcul mobil folosind date și senzori care sunt locali și/sau la distanță de dispozitivul de calcul mobil.

Modificare care implică dezambiguizarea intrării de căutare în funcție de context

Cândva, când optimizai o pagină pentru o interogare, probabil că era o interogare efectuată de cineva care stătea la un birou folosind un computer desktop sau un laptop. Acum ar putea fi cineva într-o mașină sau într-un autobuz sau tren, sau pe culoarele unui magazin sau la o cafenea. Când caută „New York, New York”, poate fi pentru că vor indicații de trafic, sau pentru a asculta o melodie sau pentru a citi o pagină web pentru a afla ce se întâmplă în centrul orașului.

Îmi amintesc că am vizitat-o ​​pe sora mea când a mers la școală în Manhattan și ne-a sugerat să aflăm dacă au avut loc festivaluri de stradă în oraș în acea zi. Ea a ridicat telefonul și a sunat 411 și a întrebat un operator. Asta s-a întâmplat cu aproximativ 5 ani înainte ca World Wide Web să fie folosit pentru a afla, iar ea a primit răspunsuri de la operatori, ceea ce m-a surprins enorm. Nu mă așteptam la acele răspunsuri de la acea sursă. M-aș aștepta acum să găsesc o pagină Web care să-mi spună despre acestea, dar nu m-aș fi așteptat să găsesc astfel de informații folosind un computer sau un telefon mobil într-o zi în viitor. Lumea se schimbă.

Cât de pregătit ești pentru schimbările pe care ni le vor aduce dispozitivele mobile și motoarele de căutare?