Comment Google peut utiliser les avis pour en savoir plus sur les attributs d'entité
Publié: 2018-09-06
A propos des attributs d'entité
Lorsque nous voyons Google parler des propriétés de différentes entités, ils les appellent souvent attributs d'entité et les définissent souvent dans des paires clé/valeur. Par exemple, Abraham Lincoln a une hauteur de 6'4″. Alphabet est une société holding dont le siège est à Mountain View, en Californie. Paul Newman a les yeux bleus. Fortnite est un jeu multijoueur.
Certains avis en ligne concernent spécifiquement des entités telles que des produits, des créateurs de produits et/ou des vendeurs de produits. Ces avis peuvent contenir des informations sur les attributs d'entités susceptibles d'intéresser les chercheurs. Un brevet accordé à Google la semaine dernière nous indique qu'il peut collecter des informations sur les attributs d'entités à partir d'avis susceptibles d'intéresser les chercheurs, et comment ils peuvent le faire. C'est important, car comme le brevet nous l'indique :
Ces types d'avis d'utilisateurs peuvent inclure des informations sur des entités qui peuvent ne pas avoir été fournies ou générées, par exemple, par les entités elles-mêmes.
Les informations sur les attributs des entités passent des avis à l'index de Google
Ce processus impliquant des attributs d'entité peut impliquer :
(1) Identifier , sur la base d'un corpus de requêtes d'utilisateurs, une ou plusieurs catégories d'intérêt des utilisateurs observés ;
(2) Détecter , dans un ou plusieurs avis d'utilisateurs associés à un produit, un ou plusieurs segments de texte liés à la ou aux catégories d'intérêt des utilisateurs observés ;
(3) Et sur la base de la détection, de l' indexation , dans une base de données interrogeable, du produit sur la ou les catégories d'intérêt des utilisateurs observés.
Alors. le moteur de recherche peut examiner les requêtes concernant une entité pour identifier ce qui peut intéresser les chercheurs à propos de ces entités et utiliser ces requêtes pour identifier le texte des avis susceptibles d'intéresser les chercheurs, et indexer ce texte afin que les chercheurs puissent trouver des réponses aux les requêtes qu'ils ont sur des entités telles que des produits, des fabricants de produits et des fournisseurs de produits.
Google peut compter le nombre de requêtes portant sur certains attributs d'entité pour comprendre l'intérêt que suscitent les réponses à ces requêtes, ou quel peut être l'intérêt de l'utilisateur pour celles-ci.
L'apprentissage automatique peut être utilisé pour identifier si les requêtes s'intéressent au produit lui-même ou au fabricant du produit.
L'entité attributaire du brevet en question, délivré la semaine dernière, se trouve à l'adresse :
Analyser les avis des utilisateurs pour déterminer les attributs de l'entité
Inventeurs : Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva et Anna Patterson
Cessionnaire : GOOGLE LLC
Brevet américain : 10 061 767
Attribué : 28 août 2018
Déposé : 16 juin 2017
Résumé
L'invention concerne des procédés et un appareil pour classer des avis d'utilisateurs ou des parties de ceux-ci comme étant liés à diverses entités, et pour associer des segments descriptifs extraits de texte contenus dans ces avis d'utilisateurs ou des parties de ceux-ci avec des entités basées sur les classifications. Dans diverses mises en œuvre, une ou plusieurs catégories d'intérêt d'utilisateur observé peuvent être identifiées sur la base d'un corpus de requêtes d'utilisateur. Un ou plusieurs segments de texte liés à la ou aux catégories d'intérêt d'utilisateur observé peuvent être détectés dans un ou plusieurs avis d'utilisateur associés à un produit. Sur la base de la détection, le produit peut être indexé sur une ou plusieurs catégories d'intérêt d'utilisateur observé dans une base de données consultable. Dans certaines mises en œuvre, la base de données interrogeable peut être accessible à un ou plusieurs dispositifs clients distants, et peut être recherchée par la ou les catégories d'intérêt utilisateur observé pour fournir des résultats de recherche à restituer par le ou les dispositifs clients distants.
Les avis des utilisateurs, tels que décrits dans ce brevet, peuvent provenir de sources telles que :
- les blogs
- publications sur les réseaux sociaux
- e-mails
- articles écrits pour des sites Web ou pour des publications imprimées telles que des magazines ou des journaux
- les publications effectuées dans une section d'avis d'utilisateurs d'un fournisseur ou d'un marché en ligne
- avis d'utilisateurs soumis à divers centres d'échange d'avis d'utilisateurs existants
Ces avis peuvent ensuite être classés en fonction des catégories d'intérêt qu'ils peuvent couvrir et des entités auxquelles ils peuvent contenir des informations relatives. C'est intéressant car ce brevet nous explique comment l'apprentissage automatique peut faire partie du processus impliqué dans la réalisation de ces étapes.

Dans certaines mises en œuvre, une ou plusieurs « catégories d'intérêts » dans des entités peuvent être utilisées pour classer les avis d'utilisateurs et/ou des parties de ceux-ci comme étant liés à des entités particulières. La détection de mots ou d'expressions dans un avis d'utilisateur qui correspondent à ces catégories (par exemple, comme suffisamment similaires) peut être interprétée comme des signaux pour classer l'avis d'utilisateur ou une partie de celui-ci comme étant lié à une entité. Les catégories d'intérêt peuvent se présenter sous diverses formes, telles que les catégories d'intérêt prédit et les catégories d'intérêt observé. Dans diverses mises en œuvre, un moteur de catégories peut maintenir un index de catégories qui peut être utilisé par un moteur de classification pour classer les avis d'utilisateurs et/ou des parties de ceux-ci.
Si vous êtes un fan de jeux en ligne, le brevet fournit plusieurs exemples axés sur ceux qui décrivent le fonctionnement du processus derrière le brevet :
Des catégories d'intérêts observés, en revanche, peuvent être déterminées, par exemple, par moteur de catégorie, sur la base de modèles observés dans l'activité d'utilisateur, comme parmi une pluralité (ou corpus) de requêtes d'utilisateur. Par exemple, et en continuant avec l'exemple du marché en ligne des applications, plusieurs utilisateurs peuvent rechercher des applications en utilisant des termes ou des expressions identiques ou similaires. Si suffisamment d'utilisateurs soumettent des requêtes contenant un mot ou une phrase en particulier (ou des variantes similaires de celles-ci), le moteur de catégorie peut considérer que ces mots ou phrases constituent une catégorie d'intérêt observé et peut mettre à jour l'indexation en conséquence. Ainsi, si suffisamment d'utilisateurs recherchent sur un marché en ligne des « jeux de rôle en ligne massivement multijoueurs » ou « MMORPG », une catégorie MMORPG peut être établie.
Les processus impliquant l'extraction de texte à partir d'avis sont également décrits et incluent des éléments tels que des comparaisons entre différentes entités (telles que "Le produit X est meilleur que le produit Y.")
Le brevet accorde beaucoup d'attention à la façon dont les informations et les mots et expressions spécifiques peuvent être extraits des critiques, et répond aux requêtes, par exemple s'il y avait beaucoup de requêtes sur les « appareils photo dotés de grandes capacités de zoom optique », les informations pourraient être extrait qui a répondu à cette requête pour une caméra particulière. Et ce type d'informations peut être extrait des avis d'utilisateurs sur les appareils photo.
On nous donne un aperçu des implications de telles extractions :
Le moteur graphique peut effectuer diverses actions avec ces attributs et/ou scores d'entité nouvellement associés. Par exemple, dans certaines mises en œuvre, le moteur graphique peut s'interfacer avec un moteur de recherche (non représenté) et peut indexer une ou plusieurs entités sur la base d'un ou plusieurs segments de texte descriptifs associés à ces une ou plusieurs entités, par exemple, par texte descriptif moteur d'association.
Utilisation des avis pour en savoir plus sur les attributs d'entité
Il est intéressant de noter que Google peut utiliser du contenu généré par les utilisateurs, tel que des critiques de produits, pour en savoir plus sur ces produits, les fabricants de ces produits et les distributeurs des produits.
Nous avons vu que Google s'intéressait aux critiques de produits, d'entreprises et de lieux, car les chercheurs ont recherché ces éléments. Nous avons également vu Google parler de la façon dont ils pourraient utiliser les avis pour en savoir plus sur les sentiments concernant les entités. Ce brevet va encore plus loin dans cet intérêt, au-delà de la simple mise à disposition des critiques aux chercheurs ou de la mise en évidence de phrases remplies de sentiments. Il cherche à en savoir plus sur les éléments examinés afin de pouvoir faire correspondre des intérêts spécifiques avec des informations qui y répondent.
Le brevet nous indique où trouver des critiques en ligne, comment le texte de ces critiques peut être classé et extrait, comment l'intérêt des requêtes des chercheurs peut être externalisé pour comprendre ce que ces chercheurs peuvent être intéressés à apprendre, et qu'un moteur de recherche pourrait montrer aux chercheurs des informations qui répondent à ces intérêts sur des attributs d'entité spécifiques.
Les avis sont peut-être un bon endroit pour obtenir des informations sur les attributs d'entité que ces entités ne partagent pas elles-mêmes. Qu'en penses-tu?
