Cum poate folosi Google recenziile pentru a afla despre atributele entității
Publicat: 2018-09-06
Despre atributele entității
Când vedem că Google vorbește despre proprietățile diferitelor entități, adesea se referă la acestea drept atribute de entitate și adesea le definesc în perechi cheie/valoare. De exemplu, Abraham Lincoln are o înălțime de 6'4″. Alphabet este un holding cu sediul central în Mountain View, California. Paul Newman are ochi albaștri. Fortnite este un joc multiplayer.
Unele recenzii online se referă în special la entități precum produse, creatori de produse și/sau furnizori de produse. Aceste recenzii pot conține informații despre acele atribute ale entităților de care ar putea fi interesați utilizatorii. Un brevet acordat Google săptămâna trecută ne spune că poate colecta informații despre atributele entităților din recenzii de care ar putea fi interesați utilizatorii și cum pot face acest lucru. Acest lucru este important, deoarece așa cum ne spune brevetul:
Aceste tipuri de recenzii ale utilizatorilor pot include informații despre entități care ar putea să nu fi fost furnizate sau generate, de exemplu, de către entitățile înseși.
Informațiile despre atributele entităților trec de la recenzii la indexul Google
Acest proces care implică atributele entității poate implica:
(1) Identificarea , pe baza unui corpus de interogări ale utilizatorilor, a uneia sau mai multor categorii de interes observat al utilizatorului;
(2) Detectarea , în una sau mai multe recenzii ale utilizatorilor asociate cu un produs, a unuia sau mai multor segmente de text legate de una sau mai multe categorii de interes observat de utilizator;
(3) Și pe baza detectării, indexării , într-o bază de date căutabilă, a produsului pe una sau mai multe categorii de interes observat al utilizatorului.
Asa de. motorul de căutare poate analiza interogările despre o entitate pentru a identifica ce anume ar putea fi interesați utilizatorii în legătură cu acele entități și poate utiliza acele interogări pentru a identifica textul din recenzii de care ar putea fi interesați utilizatorii și indexează acel text astfel încât cei care caută să poată găsi răspunsuri la interogări pe care le au despre entități precum produse, producători de produse și furnizori de produse.
Google poate număra numărul de interogări care solicită anumite atribute ale entității pentru a înțelege cât de mult interes există pentru răspunsurile la acele interogări sau care este interesul utilizatorului pentru acestea.
Învățarea automată poate fi utilizată pentru a identifica dacă interogările sunt interesate de produsul în sine sau de producătorul produsului.
Entitatea atribuie brevetul în cauză, acordat săptămâna trecută, poate fi găsit la:
Analizarea recenziilor utilizatorilor pentru a determina atributele entității
Inventatori: Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva și Anna Patterson
Cesionar: GOOGLE LLC
Brevet SUA: 10.061.767
Acordat: 28 august 2018
Depus: 16 iunie 2017
Abstract
Metode și aparate sunt descrise aici pentru clasificarea recenziilor utilizatorilor sau porțiuni ale acestora ca fiind legate de diferite entități și pentru asocierea segmentelor descriptive extrase de text conținute în acele recenzii ale utilizatorilor sau porțiuni ale acestora cu entități bazate pe clasificări. În diverse implementări, una sau mai multe categorii de interes observat al utilizatorului pot fi identificate pe baza unui corpus de interogări ale utilizatorilor. Unul sau mai multe segmente de text legate de una sau mai multe categorii de interes observat al utilizatorului pot fi detectate în una sau mai multe recenzii ale utilizatorilor asociate unui produs. Pe baza detectării, produsul poate fi indexat pe una sau mai multe categorii de interes observat al utilizatorului într-o bază de date care poate fi căutată. în unele implementări, baza de date care poate fi căutată poate fi accesibilă unuia sau mai multor dispozitive client la distanţă şi poate fi căutată de către una sau mai multe categorii de interes observat al utilizatorului pentru a oferi rezultate de căutare care să fie redate de către unul sau mai multe dispozitive client la distanţă.
Recenziile utilizatorilor, așa cum sunt descrise în acest brevet, pot proveni din surse precum:
- bloguri
- postări pe rețelele sociale
- e-mailuri
- articole scrise pentru site-uri web sau pentru publicații tipărite, cum ar fi reviste sau ziare
- postări făcute într-o secțiune de recenzii a utilizatorilor a unui furnizor online sau a unei piețe
- recenziile utilizatorilor trimise la diferite centre de compensare existente pentru recenzii ale utilizatorilor
Aceste analize pot fi apoi clasificate în funcție de categoriile de interes pe care le pot acoperi și de entitățile la care pot conține informații referitoare la acestea. Este interesant, deoarece acest brevet ne spune despre modul în care învățarea automată poate face parte din procesul implicat în realizarea acestor pași.

În unele implementări, una sau mai multe „categorii de interese” în entități pot fi folosite pentru a clasifica recenziile utilizatorilor și/sau părți ale acestora ca fiind legate de anumite entități. Detectarea cuvintelor sau expresiilor într-o recenzie de utilizator care corespund acestor categorii (de exemplu, ca suficient de asemănătoare) poate fi interpretată ca semnale pentru clasificarea recenziei utilizatorului sau a unei părți a acesteia ca fiind legată de o entitate. Categoriile de interes pot veni sub diferite forme, cum ar fi categorii de interes prezis și categorii de interes observat. În diverse implementări, un motor de categorii poate menține un index de categorii care poate fi utilizat de motorul de clasificare pentru a clasifica recenziile utilizatorilor și/sau porțiuni ale acestora.
Dacă sunteți un fan al jocurilor online, brevetul oferă câteva exemple axate pe acelea pentru a descrie modul în care funcționează procesul din spatele brevetului:
Categoriile de interese observate, dimpotrivă, pot fi determinate, de exemplu, de motorul categoriei, pe baza modelelor observate în activitatea utilizatorului, cum ar fi într-o pluralitate (sau corpus) de interogări ale utilizatorilor. De exemplu, și continuând cu exemplul pieței online de aplicații, mai mulți utilizatori pot căuta aplicații folosind termeni sau expresii aceiași sau similari. Dacă suficienți utilizatori trimit interogări care conțin un anumit cuvânt sau expresie (sau variații similare ale acestuia), atunci motorul de categorii poate considera acele cuvinte sau expresii ca fiind o categorie de interes observat și poate actualiza indexul în consecință. Astfel, dacă destui utilizatori caută pe o piață online „jocuri de rol online masiv multiplayer” sau „MMORPG”, se poate stabili o categorie MMORPG.
Procesele care implică extragerea textului din recenzii sunt de asemenea descrise și includ lucruri precum comparații între diferite entități (cum ar fi „Produsul X este mai bun decât produsul Y”).
Brevetul acordă multă atenție modului în care informațiile și cuvintele și expresiile specifice ar putea fi extrase din recenzii și răspunde la interogări, cum ar fi dacă ar exista o mulțime de întrebări despre „camere care au capacități mari de zoom optic”, informațiile ar putea fi extras care a răspuns la acea interogare pentru o anumită cameră. Și acest tip de informații ar putea fi preluate din recenziile utilizatorilor despre camere.
Ni se oferă un indiciu despre implicațiile unor astfel de extrageri:
Motorul de grafice poate efectua diverse acțiuni cu aceste atribute și/sau scoruri de entitate nou asociate. De exemplu, în unele implementări, motorul grafic poate interfața cu un motor de căutare (nu este reprezentat) și poate indexa una sau mai multe entități pe baza unuia sau mai multor segmente descriptive de text care sunt asociate cu acele una sau mai multe entități, de exemplu, prin text descriptiv motor de asociere.
Utilizarea recenziilor pentru a afla despre atributele entității
Este interesant faptul că Google poate folosi conținut generat de utilizatori, cum ar fi recenzii ale produselor, pentru a afla despre acele produse, despre producătorii acelor produse și despre distribuitorii produselor.
Am văzut că Google a avut un interes pentru recenziile produselor și companiilor și locurilor, deoarece utilizatorii au căutat acele lucruri. Am văzut, de asemenea, că Google a vorbit despre cum ar putea folosi recenziile pentru a afla despre sentimentul față de entități. Acest brevet duce acest interes cu un pas mai departe, dincolo de simpla punere la dispoziție a recenziilor pentru cei care caută sau de a sublinia propoziții pline de sentimente. Acesta caută să învețe despre lucrurile care sunt revizuite, astfel încât să poată potrivi interese specifice cu informații care răspund la acestea.
Brevetul ne spune despre unde pot fi găsite recenzii online, cum poate fi clasificat și extras textul din acele recenzii, cum interesul din interogările utilizatorilor de căutare poate fi crowdsourced pentru a înțelege ce ar putea fi interesați să învețe acești utilizatori și că un motor de căutare le-ar putea arăta celor care caută. informații care răspund la acele interese despre atributele specifice ale entității.
Poate că recenziile sunt un loc bun pentru a afla informații despre atributele entităților pe care acele entități nu le distribuie. Ce crezi?
