Le référencement passe des mots clés aux ontologies et aux modèles de requête

Publié: 2018-03-05

Hauteur de Barack Obama

Des mots-clés aux ontologies à l'aide de modèles de requête

Lorsque nous demandons à Google « Quelle est la taille de Barack Obama », nous ne recherchons pas des pages correspondant à certains mots-clés, mais plutôt des informations factuelles sur la personne qui était le 44e président des États-Unis. Les types de recherches que nous effectuons et les façons dont les moteurs de recherche collectent les informations, les indexent et renvoient des réponses avec elles changent. Cette transformation est un processus continu et Google fait toujours correspondre les mots-clés des requêtes aux mots-clés des documents Web ; donc faire une recherche par mot-clé continue d'avoir du sens. Mais comprendre comment ce changement a lieu nous permet de planifier pour l'avenir et où les moteurs de recherche peuvent aller.

Nous avons vu des brevets de Google qui nous renseignent sur des choses telles que la façon dont les entités de la base de connaissances peuvent être utilisées dans les recherches. Lorsque Google a présenté son graphique de connaissances en 2012, il nous a dit qu'il commençait à se concentrer sur les choses plutôt que sur les chaînes. Ces chaînes sont des chaînes de texte, comme dans les mots-clés entrés dans un champ de recherche mis en correspondance sur des documents. Une transformation de la recherche axée sur les objets signifie qu'un moteur de recherche parcourrait les pages Web en collectant des informations sur les attributs et les propriétés des entités. Cela aurait plus d'importance sur des choses telles qu'une ontologie, qui est définie comme ceci :

Une ontologie est un nom formel et une définition des types, des propriétés et des interrelations des entités qui existent dans un domaine particulier du discours.

Modèles de requête

modèles de requête

Nous voyons Google utiliser des graphiques de questions pour afficher des questions connexes dans les résultats de recherche, et cela fait attention à la façon dont les entités de ces questions peuvent être connectées. J'ai écrit à ce sujet dans, Les questions connexes sont rejointes par les raffinements « Les gens recherchent également » ; Maintenant en utilisant un graphique de question.

Un brevet Google récemment accordé décrit comment des requêtes peuvent être créées sur des entités spécifiques qui répondent aux questions que les chercheurs peuvent avoir, et comprennent les modèles de requêtes qui peuvent conduire à répondre à plus de questions. Comme le résumé du brevet nous le dit :

En général, un aspect innovant du sujet décrit dans cette spécification peut être incorporé dans des méthodes qui incluent le crowdsourcing de la génération d'un ou plusieurs modèles de requête textuelle relatifs à un ou plusieurs faits concernant une personne, un lieu ou une chose en particulier. Par exemple, les utilisateurs d'un système basé sur Internet peuvent recevoir une déclaration qui énonce un fait à propos d'une chose particulière, telle que "Barack Obama mesure 6'1". En réponse, les utilisateurs du système basé sur Internet peuvent générer et envoyer une ou plusieurs requêtes qui pourraient être utilisées pour récupérer le fait, comme la question « Quelle est la taille de Barack Obama ? ou une requête qui inclut les termes de la requête « hauteur de Barack Obama ».

Biperpedia : une approche pour construire une ontologie basée sur des flux de requêtes

Il y avait un article de Google qui couvre une partie de ce territoire appelé Biperpedia: An Ontology for Search Applications, avec lequel il est fortement recommandé de passer du temps. Les idées de ce brevet semblent être des lignes directrices sur la façon dont l'ontologie Biperpedia a été développée. L'objectif de l'ontologie Biperpedia est d'aider à construire une ontologie qui peut être utilisée pour aider à renvoyer des résultats de recherche. Nous voyons cela décrit dans le résumé du brevet ici :

Les requêtes peuvent être évaluées par d'autres utilisateurs du système basé sur Internet pour supprimer les requêtes qui incluent une mauvaise grammaire, utilisent une structure de phrase maladroite, ne sont pas dirigées vers le fait fourni dans la déclaration, ou sont autrement moins utiles que d'autres requêtes pour solliciter le particulier fait. Les requêtes restantes peuvent être normalisées en modèles de requête, par exemple, en supprimant la ponctuation de chaque requête, en corrigeant les fautes d'orthographe, en convertissant les termes de la requête dans chaque requête en une représentation en minuscules, en supprimant les "mots vides" de chaque requête, et en utilisant d'autres techniques de normalisation.

Les modèles de requête peuvent être généralisés en modèles de requête généralisés qui peuvent être associés à un ou plusieurs faits stockés par un système de recherche. Ces associations peuvent être utilisées ultérieurement lorsqu'un utilisateur soumet une requête qui sollicite un fait du système de recherche. Par exemple, la requête « Quelle taille mesure Barack Obama ? » peut être stocké en tant que modèle de requête [comment mesure Barack Obama], qui peut être généralisé dans le modèle de requête généralisé [comment taille/Personne/] et associé à chaque valeur de taille pour chaque personne stockée par le système de recherche. Ensuite, lorsque le système de recherche reçoit la requête « Quelle taille mesure Abraham Lincoln ? » le système de recherche peut obtenir la réponse en faisant correspondre les termes de la requête au modèle de requête généralisé. Par exemple, les termes de la requête peuvent être normalisés en [quelle est la taille d'Abraham Lincoln] et mis en correspondance avec un modèle de requête généralisé [comment mesure la taille/Personne/].

Le brevet nous dit qu'il recherche des modèles de requête dans les requêtes des utilisateurs pour voir s'il en reconnaît. La plupart des brevets sont créés pour résoudre des problèmes particuliers. Celui-ci énonce exactement pourquoi il existe en ces termes :

Des modes de réalisation particuliers du sujet décrit dans cette description peuvent être mis en œuvre pour réaliser un ou plusieurs des avantages suivants. L'efficacité des données et des calculs peut être réalisée car un nombre relativement important de faits peut être identifié sur un large éventail de sujets en recevant un nombre relativement faible de modèles de requête. Les modèles de requête reçus peuvent être validés ou filtrés d'une autre manière avant d'être associés à des faits ou à des sujets, améliorant ainsi la précision globale des faits pouvant être fournis par le système en réponse à une question.

Comprendre les modèles de requête qui peuvent être demandés sur des types particuliers d'entités est le chemin pour répondre aux requêtes factuelles posées par un chercheur. Le brevet des modèles de requêtes accordé le mois dernier est :

Apprentissage du modèle de requête factuel
Inventeurs : Junli Xian, Engin Cinar Sahin, John Blitzer et Emma S. Persky
Cessionnaire : Google Inc.
Brevet américain : 9 898,512
Attribué : 20 février 2018
Déposé : 13 mai 2015

Résumé

Procédés, systèmes et appareils, y compris des programmes informatiques codés sur un support de stockage informatique, pour fournir une déclaration qui fait référence à un attribut particulier d'un sujet particulier, en réponse à la fourniture de la déclaration, en obtenant un ou plusieurs modèles de requête qui comprennent chacun un ou plusieurs termes de requête qui sont utilisés dans les requêtes soumises à un système de recherche pour obtenir une valeur pour l'attribut particulier du sujet particulier, généraliser un ou plusieurs des modèles de requête, et associer le ou les modèles de requête généralisés à un ou plusieurs autres sujets qui inclure l'attribut particulier.

À emporter

Anticiper les questions que votre public cible pourrait avoir sur la couverture de vos pages peut être un exercice qui vaut la peine d'être entrepris. Si vous connaissez les entités sur lesquelles portent vos pages, que vous en faites les vedettes de vos pages, que vous répondez aux questions que les gens peuvent se poser à leur sujet et que vous devenez les sources d'information faisant autorité à leur sujet, c'est probablement la voie vers le succès sous une ontologie approche basée sur des modèles de requêtes et une ontologie basée sur les flux de requêtes. Sur lequel j'ai écrit plus à: 3 Ways Query Stream Ontologies Change Search