Recherche sémantique : un guide complet pour comprendre et optimiser la recherche sémantique

Publié: 2016-01-27

Table des matières

Qu'est-ce que la recherche sémantique et l'indexation sémantique latente (LSI)

LSI (Latent Semantic Indexing) est un moyen par lequel les moteurs de recherche déterminent si votre contenu est vraiment sur le sujet et en profondeur ou simplement du spam. Les moteurs de recherche le déterminent en examinant les mots d'un article et en décidant de leur pertinence les uns par rapport aux autres. Par exemple, pour un article sur les ordinateurs, les moteurs de recherche savent que les mots suivants sont étroitement liés à « ordinateurs » et apparaîtront probablement dans tout bon article sur les ordinateurs : disque dur, processeur, RAM, moniteur, carte mère, ghz, mhz, Intel, Nvidia, etc… Ce sont des termes LSI.

Voici donc ce qui se passe lorsque le moteur de recherche trouve votre article :

1. Il lit l'article

2. Il détermine la «densité de mots-clés» de chaque mot ou phrase de l'article. Cela signifie qu'il examine le nombre total de mots dans l'article et trouve combien de fois des mots ou des phrases particuliers sont répétés dans l'article. Les mots et les phrases qui sont répétés plus souvent ont une densité de mots clés plus élevée. C'est ainsi que le moteur de recherche sait de quoi parle votre article. Ainsi, pour un article sur les "boîtiers de PC de bureau", cette phrase peut apparaître 4 fois dans votre article de 700 mots. Cela lui donnerait une densité d'environ 1,7 %. (12/700 = 1,7 %).

Nous utilisons 12 parce que les "boîtes pour PC de bureau" sont composées de 3 mots, donc 3 mots X 4 apparences = 12. Vous pouvez aider le moteur de recherche à comprendre de quoi parle votre article en incluant le mot-clé dans le titre, le premier paragraphe et le dernier paragraphe de votre article, car les moteurs de recherche savent mettre davantage l'accent sur ces domaines de l'article.

3. Il sélectionne les mots et les expressions avec la densité de mots clés la plus élevée et les utilise pour déterminer le sujet de l'article (en substance, l'article se voit attribuer un « score de pertinence »). Ainsi, pour notre exemple de « boîtiers de PC de bureau », s'il trouve une densité de mots clés élevée de « boîtiers de PC de bureau », alors il sait s'attendre à des densités élevées d'autres termes connexes (termes LSI), comme : ATX, refroidissement, alimentation, carte mère, étui de jeu, étui personnalisé, etc…

Les moteurs de recherche savent à quels termes associés s'attendre pour un mot-clé donné ; ils sont devenus assez intelligents. Ainsi, s'ils s'attendent à voir certains mots-clés associés dans l'article mais qu'ils ne trouvent pas ces mots-clés, ils lui attribuent un score de pertinence inférieur. Cela a un impact direct sur le classement de cet article dans les moteurs de recherche lorsque quelqu'un recherche votre mot-clé cible.

Le LSI est un concept clé en SEO (Search Engine Optimization). Les algorithmes des moteurs de recherche s'améliorent constamment et, en ce moment, ils récompensent un contenu qui présente un bon équilibre entre les termes LSI et le mot-clé principal de l'article. Donc, si votre plan est d'utiliser le contenu que vous écrivez pour créer un site Web, optimiser ce site Web pour le référencement et monétiser le trafic qui arrive sur le site Web, il est important que vos articles contiennent un bon mélange de termes LSI. Alors quand je lis des articles, je les lis sous deux angles différents :

1. Humain (Est-ce que ça se lit bien ?)

2. SEO Specialist/search engine spider (Y a-t-il une bonne densité de mots clés ? Y a-t-il beaucoup de termes LSI ?)

Donc, pour les futurs efforts de marketing d'articles, essayez d'incorporer les termes LSI. Pensez simplement aux termes qui sont propres au créneau pour lequel vous écrivez. Souvent, ces termes apparaîtront de manière organique au fur et à mesure que vous écrivez. Mais pour de meilleurs résultats, vous devez être conscient de la façon dont les robots des moteurs de recherche vont lire votre contenu.

Prenez ce billet de blog, par exemple. Le sujet principal de cet article est LSI (indexation sémantique latente), mais j'ai saupoudré un tas de termes LSI dans cet article :

  • Référencement
  • teneur
  • pertinent
  • mot-clé
  • densité de mots clés
  • moteur de recherche
  • optimisation du moteur de recherche
  • Site Internet
  • commercialisation d'articles
  • rang
  • monétiser

Tous ces termes sont liés à LSI et à la catégorie plus large du référencement, que les moteurs de recherche reconnaîtront lorsque leurs araignées parcourront cet article. Et le résultat ? Cet article de blog se verra attribuer un score de pertinence plus élevé pour ces catégories. Et cela signifie qu'il sera mieux classé dans les pages de résultats des moteurs de recherche (SERP). Aussi simple que cela.

Maintenant, ne vous méprenez pas; LSI n'est pas le seul facteur déterminant du classement de votre contenu dans les SERP. En fait, ce n'est qu'un facteur parmi des centaines, voire des milliers. Cela dit, cela prend de l'importance dans les algorithmes des moteurs de recherche, il vaut donc la peine d'y penser lorsque vous écrivez du contenu optimisé pour le référencement.

Les tendances de recherche dépendent d'un certain nombre de technologies en interaction étroite, et vous devez être conscient de leur évolution si vous voulez garder une longueur d'avance sur la concurrence, d'autant plus que les taux de changement s'accélèrent dans tous les domaines. Il existe des technologies d'appareils, qui nous ont fourni des appareils mobiles et des formes plus sophistiquées de recherche locale, des technologies Web, qui ont permis à un plus grand nombre d'entreprises de créer des sites Web plus créatifs, et des technologies de recherche brute, qui rendent la recherche plus rapide, plus facile et plus pertinents pour les utilisateurs (parmi d'autres classes de technologie).

Parmi les technologies de recherche, l'une des plus fascinantes – et celle qui évolue le plus rapidement – ​​est la recherche sémantique, la capacité des moteurs de recherche à reconnaître et à interpréter le langage naturel des requêtes de ses utilisateurs. La recherche sémantique évolue de manière étonnante, et plus tôt vous commencerez à vous y adapter, mieux ce sera.

Colibri (2013)

Hummingbird (2013)

Au début des années 2000, la « recherche sémantique » n'existait pas et la reconnaissance du langage naturel semblait être un rêve lointain pour l'IA. Les moteurs de recherche fonctionnaient à l'aide d'un système de cartographie basé sur des mots clés ; ils identifieraient certains mots clés et expressions de mots clés dans votre requête, puis généreraient une liste des endroits sur le Web où ces termes étaient utilisés le plus fréquemment et le plus en évidence. Au fil des ans, ce processus est devenu plus sophistiqué, éliminant les pages anormalement remplies de mots-clés et mappant des phrases plus compliquées, mais il fonctionnait essentiellement de la même manière.

La mise à jour Hummingbird de Google a changé la donne lors de sa sortie en 2013. Plutôt que d'utiliser des mots-clés pour trouver les résultats les plus pertinents pour une requête, Hummingbird pourrait interpréter l'intention d'une requête utilisateur en fonction de sa formulation et trouver des entrées pertinentes à partir de là. Son émergence a marqué un écart important par rapport aux stratégies basées sur les mots clés des optimiseurs de recherche, forçant plutôt les spécialistes du marketing de contenu à faire plus d'efforts pour répondre aux questions, aux préoccupations et aux intérêts des utilisateurs.

RangBrain (2015)

RankBrain (2015)

À la fin de l'année dernière, Google a publié un nouvel algorithme d'apprentissage automatique pour Hummingbird appelé RankBrain. L'objectif de l'algorithme est d'améliorer les capacités de recherche sémantique de Hummingbird en en apprenant progressivement plus sur la façon dont les gens parlent (et saisissent des requêtes dans les moteurs de recherche). Bien que la recherche sémantique soit déjà assez impressionnante, elle a du mal lorsque la requête d'un utilisateur est particulièrement verbeuse, complexe ou ambiguë. RankBrain apprend des expériences antérieures, se mettant essentiellement à jour et finit par être capable de décomposer ces requêtes complexes et indéchiffrables en morceaux plus gérables. C'est un signe de l'engagement de Google envers des phases d'amélioration sans fin. Sans le mur temporel et logistique entre les ingénieurs et les mises à jour manuelles, cet algorithme automatisé pourra se développer plus rapidement que jamais.

Réponses riches (en cours)

Rich Answers (Ongoing)

Vous avez sans aucun doute remarqué une augmentation du nombre de « réponses riches », qui est le terme donné aux entrées concises dans les SERP, qui sont plus importantes que les résultats de recherche standard. Ceux-ci peuvent prendre la forme d'images, de phrases, de paragraphes, de chiffres ou de tout autre type de réponse pouvant répondre immédiatement et de manière concise à votre requête (sans jamais vous obliger à cliquer sur une page distincte). Leur prévalence augmente pour trois raisons :

  • Le Knowledge Graph de Google s'agrandit continuellement avec plus d'informations sur plus de sujets
  • Hummingbird et RankBrain comprennent de mieux en mieux les requêtes des utilisateurs
  • Google veut donner des réponses courtes et immédiates dans la mesure du possible

C'est l'un des effets les plus importants de l'augmentation de l'analyse de la recherche sémantique, car elle réduit le recours aux pages Web externes pour répondre aux questions. Il a été avancé que cela finirait par étouffer le trafic de recherche vers tous les sites Web, mais nous traverserons ce pont lorsque nous y arriverons.

Questions connexes (en cours)

Related Questions (Ongoing)

Les questions connexes connaissent également une augmentation, en particulier au cours des derniers mois. Vous pouvez les voir apparaître à mi-chemin de vos résultats de recherche, vous invitant à enquêter sur des questions similaires ou fréquemment posées liées à votre requête d'origine. Cependant, vous remarquerez que les réponses à ces questions diffèrent souvent de leurs homologues à réponses riches, ce qui implique qu'un algorithme distinct est chargé de les générer. On ne sait pas comment tout cela est lié, mais il est clair que Google a un plan à long terme pour la reconnaissance des modèles de requêtes en plus d'une compréhension sémantique de base.

Développements à surveiller

Si vous avez lu cet article dans une perspective SEO, vous vous demandez peut-être comment tout cela vous affecte. Oui, il est intéressant d'apprendre la mécanique interne et l'histoire des capacités de recherche sémantique de Google, mais avec quelles informations pratiques pouvez-vous partir ?

Tout d'abord, comprenez les domaines clés que Google développe (soit via des mises à jour plus manuelles, soit avec ses nouveaux algorithmes d'apprentissage automatique) : recherche vocale, compréhension sémantique, réponses riches et questions connexes. La principale préoccupation de Google est de mettre des informations correctes et pertinentes à la disposition des chercheurs aussi rapidement et facilement que possible.

Votre objectif devrait donc être d'aider Google à faire le travail. Passez plus de temps à rechercher des questions courantes dans votre secteur et à y répondre. Explorez des sujets complexes et de niche et microformatez votre site afin que Google puisse le scanner à la recherche de réponses. Faites-vous connaître comme une autorité et fournissez les informations que vos utilisateurs souhaitent, et vous serez récompensé sous la forme d'une plus grande visibilité. C'est aussi simple que ça.

Comment optimiser pour la recherche sémantique, au lieu des mots clés

La recherche sémantique tente plutôt d'analyser l'intention derrière la requête d'un utilisateur, donc dans notre exemple ci-dessus, plutôt que de cartographier les mots-clés inclus dans la requête, elle examinerait la phrase entière et déterminerait que cet utilisateur essaie de trouver le dentiste le mieux noté dans la ville de Bristol. Il utiliserait ensuite des indices contextuels provenant de sites et d'indicateurs externes pour évaluer quels dentistes opèrent à Bristol, et parmi eux, lesquels sont les meilleurs.

Sachant cela, vous pouvez commencer à apporter les changements significatifs nécessaires pour vous assurer que votre site est évalué et répertorié correctement.

Ajuster les titres de vos pages

Adjusting Your Page Titles

Votre première étape consiste à ajuster les titres de vos pages (et les méta descriptions, pendant que vous y êtes). C'est toujours une bonne idée d'utiliser des mots qui sont pertinents pour votre entreprise, et des mots que les gens pourraient inclure dans leurs recherches, mais il y a quelques autres facteurs à prendre en compte.

Tout d'abord, assurez-vous que votre phrasé est naturel et non maladroit. L'optimisation centrée sur les mots-clés peut vous amener à écrire des titres comme « Dentist bucco-dentaire à Bristol TN », qui ne ressemble pas à une phrase qu'une personne normale pourrait écrire. Écrivez des phrases complètes et concises, et soyez aussi précis que possible descriptif de vos pages. Tant qu'il y a une forte indication de qui vous êtes et de ce que vous faites, vous serez en bonne forme.

Deuxièmement, faites attention à la répétition. L'optimisation centrée sur les mots clés vous obligerait à répéter une phrase spécifique sur plusieurs titres et descriptions sur l'ensemble de votre site. Dans la recherche sémantique, cela peut en fait jouer contre vous. N'hésitez pas à cibler quelques phrases qui pourraient vous donner un avantage concurrentiel, mais gardez vos pages aussi diversifiées que possible.

Choisir les bons sujets

Choosing the Right Topics

Le contenu continu est votre meilleure chance d'optimiser la recherche sémantique. Souvent, les gens tapent des questions complètes ou des requêtes à longue traîne dans Google, et c'est alors le travail de Google de trouver, non pas le contenu avec le plus de mots-clés communs à la requête, mais le contenu qui répond suffisamment à la question de l'utilisateur. En conséquence, votre contenu doit viser à répondre de manière succincte et descriptive au plus grand nombre possible de requêtes d'utilisateurs potentiels.

Les articles « Comment faire », « pourquoi » et « quoi » sont des outils incroyables pour cela. Apprenez à connaître votre clientèle existante et découvrez les questions courantes qu'ils se posaient lorsqu'ils recherchaient pour la première fois une entreprise comme la vôtre. Rédigez des articles qui répondent directement à ces questions (avec des titres descriptifs et pointus), et vous devriez avoir peu de mal à classer ces requêtes lorsqu'elles se présentent. Plus votre créneau est spécifique ici, mieux c'est.

Écrire de la bonne voix

Writing in the Correct Voice

Lorsqu'il s'agit de rédiger du contenu sur site et des articles en cours, vous n'aurez pas grand-chose à changer dans votre approche. Cependant, il y a deux considérations que vous devez intégrer. Tout d'abord, rappelez-vous qu'il n'est pas nécessaire d'insérer des mots-clés dans vos articles. Concentrez vos efforts sur la concision et la description, et le reste devrait venir naturellement. Deuxièmement, sachez que la plupart des requêtes sémantiques sont longues et conversationnelles, alors essayez de rendre votre contenu un peu plus conversationnel en conséquence. Les tons conversationnels et décontractés sont plus accessibles pour les lecteurs. Ainsi, en plus de maximiser votre visibilité potentielle, vous augmenterez également votre rétention.

Le facteur RankBrain

Enfin, je veux mentionner RankBrain. RankBrain est le nouveau module complémentaire d'IA de Google pour Hummingbird, conçu pour mettre à jour l'algorithme de Google automatiquement et régulièrement afin d'améliorer sa compréhension sémantique des requêtes. En termes simples, son travail consiste à identifier des types de requêtes complexes et ambigus et à les mapper à des versions plus simples et plus naturelles. Par conséquent, votre stratégie de contenu doit se concentrer sur les versions les plus simples et les plus naturelles des requêtes. Au lieu de viser un public de niche rare avec des phrases complexes, essayez de garder votre voix aussi naturelle et concise que possible.

Quel est l'avenir de la recherche sémantique

Google est déjà assez impressionnant. Il est capable de deviner raisonnablement la signification de votre expression de recherche donnée, même avec la mise à jour élémentaire de Hummingbird. Mais l'avenir de la recherche sémantique s'étendra probablement bien au-delà des limites actuelles de la technologie des algorithmes.

Déjà, Google commence à intégrer divers facteurs externes dans ses résultats de recherche, sur la base de vos propres données personnelles. Cela peut vous faire peur d'apprendre que cela se produit, mais cela vous donne également des résultats beaucoup plus pertinents. Google sait probablement exactement où vous habitez et peut utiliser votre historique de recherche précédent pour personnaliser les résultats de la recherche prédictive.

Si nous prenons ces facteurs et les intégrons dans un environnement basé sur la recherche sémantique, nous nous retrouvons avec un moteur de recherche qui peut deviner les intentions des utilisateurs en fonction de leur comportement antérieur, peut-être même avant qu'ils ne le recherchent. En utilisant les mégadonnées pour analyser et interpréter les modèles de comportement basés sur l'individualité, l'heure de la journée, l'activité sur les réseaux sociaux et même les actualités récentes, Google pourrait amener le monde de la recherche dans une direction auparavant limitée à la science-fiction. Nous sommes probablement à une décennie ou plus de la construction d'une machine capable de deviner avec précision ce que vous pensez, mais connaissant Google, nous sommes probablement déjà plus proches que vous ne le pensez.

Comment ajuster votre stratégie de marketing de contenu

How to Adjust Your Content Marketing Strategy

À certains égards, votre stratégie de marketing de contenu ne devrait pas changer. À l'heure actuelle, les stratégies de contenu centrées sur le sujet ont tendance à porter leurs fruits. Écrire sur un sujet donné attirera naturellement les personnes recherchant des mots-clés liés à ce sujet. Il s'agit de donner aux gens ce qu'ils recherchent, et ce principe fondamental restera ferme.

Cependant, pour s'adapter à la révolution à venir de la recherche sémantique, vous devez aller plus loin. Vous devez comprendre la raison pour laquelle les gens recherchent un sujet donné. C'est une façon élégante de dire que vous devez mieux comprendre vos données démographiques, par le biais d'enquêtes, d'études et d'analyses de données volumineuses . Comprenez exactement ce qui motive vos clients à rechercher un sujet donné et étendez votre stratégie de contenu pour couvrir ces motivations périphériques.

Cela vous donnera une longueur d'avance sur les moteurs de recherche. Google tentera de comprendre ce qui motive votre client, mais vous le saurez déjà. Et si vous pouvez leur fournir cela avec pertinence, unicité et qualité, Google vous récompensera avec un rang élevé.

Conclusion

La recherche sémantique ne va pas disparaître de sitôt, et vos concurrents sont peut-être déjà en train de planifier pour la conquérir à leur manière. Gardez cela à l'esprit lorsque vous auditez votre site Web, analysez et façonnez votre stratégie cette année et au-delà. Le succès en référencement ne consiste pas à trouver quelque chose qui fonctionne et à s'y tenir pour toujours ; il s'agit d'affiner constamment votre approche pour s'adapter à ces nouvelles tendances captivantes à mesure qu'elles émergent.