Taux de clics des utilisateurs et classement des résultats de recherche sur Google
Publié: 2019-03-19Google examine-t-il les taux de clics et le comportement des utilisateurs pour influencer les classements de recherche ?
Les porte-parole de Google nous ont dit que Google n'incluait pas les taux de clics des utilisateurs lors du classement des pages dans les classements de recherche - ils sont trop bruyants et pour d'autres raisons. Un nouveau brevet de Google décrit comment les taux de clics des utilisateurs et d'autres informations sur le comportement des utilisateurs peuvent influencer les classements dans les résultats de recherche. Ce nouveau brevet n'est pas le premier à protéger un processus Google des autres moteurs de recherche qui pourraient envisager ce processus. Après les premiers brevets sur les chercheurs interagissant avec les résultats de recherche et sur la manière dont ces informations pourraient être utilisées pour influencer les classements de recherche, il devient curieux que de telles informations continuent d'apparaître dans Google Patents, et cela invite à examiner de plus près des éléments tels que le clic de l'utilisateur. Grâce aux tarifs. Surtout quand les approches impliquées sont devenues plus détaillées.
Ce brevet a été mis à jour trois fois en utilisant des brevets de continuation. Les brevets de continuation sont des moyens de mettre à jour les revendications d'un brevet pour refléter les changements dans les processus derrière un brevet. Le brevet nous indique que les classements de recherche peuvent être basés sur le temps qu'un chercheur peut passer à consulter une page à partir des résultats de recherche et que les documents peuvent ensuite être mieux classés en fonction de leur consultation pendant de plus longues périodes :
Un aspect du sujet décrit dans cette spécification peut être incorporé dans un procédé mis en œuvre par ordinateur qui comprend la détermination d'une mesure de pertinence pour un résultat de document dans un contexte d'une requête de recherche pour laquelle le résultat de document est renvoyé, la détermination étant basée sur le premier nombre concernant un deuxième nombre, le premier nombre correspondant à des vues plus longues du résultat du document, et le deuxième nombre correspondant à des vues au moins plus courtes du résultat du document ; et délivrer la mesure de pertinence à un moteur de classement pour le classement des résultats de recherche, y compris le résultat du document, pour une nouvelle recherche correspondant à la requête de recherche. Le premier nombre peut inclure un certain nombre de vues plus longues du résultat du document, le deuxième nombre peut inclure un nombre total de vues du résultat du document, et la détermination peut comprendre la division du nombre de vues plus longues par le nombre total de vues.
Le procédé peut en outre comprendre le suivi de sélections individuelles du résultat du document dans le contexte de la requête de recherche pour laquelle le résultat du document est renvoyé ; pondérer des vues de document résultant des sélections sur la base d'informations de longueur de visualisation pour produire des vues pondérées du résultat de document ; et combiner les vues pondérées du résultat du document pour déterminer le premier nombre. Le deuxième nombre peut comprendre un nombre total de vues du résultat du document, la détermination peut comprendre la division du premier nombre par le deuxième nombre, et la mesure de pertinence peut être indépendante de la pertinence pour d'autres résultats de document renvoyés en réponse à la requête de recherche.
C'est un peu plus compliqué que de simplement regarder le temps de visualisation des documents. Le brevet suggère également que les catégories de la requête de recherche pour lesquelles ces documents sont trouvés peuvent également jouer un rôle dans l'impact du temps de visualisation et des taux de clics des utilisateurs :
La pondération peut comprendre la pondération des vues de document sur la base des informations de longueur de visualisation en conjonction avec un différentiateur de longueur de visualisation. Le différenciateur de longueur de visualisation peut comprendre un facteur régi par une catégorie déterminée de la requête de recherche, et la pondération peut comprendre la pondération des vues de document sur la base de la catégorie déterminée de la requête de recherche. Le différenciateur de longueur de visualisation peut comprendre un facteur régi par un type déterminé d'utilisateur générant les sélections individuelles, et la pondération peut comprendre la pondération des vues de document sur la base du type déterminé de l'utilisateur.
Les avantages dont on nous dit que suivre le processus décrit dans ce brevet sur les taux de clics des utilisateurs peut apporter :
- Un sous-système de classement peut comprendre un moteur de modification de classement qui utilise un retour utilisateur implicite pour provoquer un reclassement des résultats de recherche afin d'améliorer le classement final présenté à un utilisateur d'un système de recherche d'informations.
- Les sélections des utilisateurs des résultats de recherche (données de clic) peuvent être suivies et transformées en une fraction de clic qui peut être utilisée pour reclasser les futurs résultats de recherche.
- Les données peuvent être collectées sur une base par requête, et pour une requête donnée, les préférences de l'utilisateur pour les résultats du document peuvent être déterminées.
- De plus, une mesure de la pertinence (par exemple, une fraction de clic LC|C) peut être déterminée à partir des commentaires implicites des utilisateurs, où la mesure de la pertinence peut être indépendante de la pertinence pour les autres résultats du document renvoyés en réponse à la requête de recherche, et la mesure de la pertinence La pertinence peut réduire les effets du biais de présentation (dans les résultats de recherche affichés à un utilisateur), qui pourraient autrement se répercuter sur les commentaires implicites.
Cette dernière version de ce brevet sur les taux de clics des utilisateurs est disponible à l'adresse :
Modification du classement des résultats de recherche en fonction des commentaires implicites des utilisateurs
Inventeurs : Hyung-Jin Kim, Simon Tong, Noam M. Shazeer et Michelangelo Diligenti
Cessionnaire : Google LLC
Brevet américain : 10 229 166
Accordé : 12 mars 2019
Déposé : 25 octobre 2017
Résumé
La présente invention concerne des systèmes et des techniques relatifs au classement des résultats de recherche d'une requête de recherche. En général, le sujet décrit dans cette spécification peut être incorporé dans un procédé mis en œuvre par ordinateur qui comprend la détermination d'une mesure de pertinence pour un résultat de document dans un contexte d'une requête de recherche pour laquelle le résultat de document est renvoyé, la détermination étant basée sur le premier nombre autour d'un deuxième nombre, le premier nombre correspondant à des vues plus longues du résultat du document, et le deuxième nombre correspondant à des vues au moins plus courtes du résultat du document ; et délivrer la mesure de pertinence à un moteur de classement pour le classement des résultats de recherche, y compris le résultat du document, pour une nouvelle recherche correspondant à la requête de recherche. L'objet décrit dans cette description peut également être incorporé dans divers produits de programme informatique, appareils et systèmes correspondants.
Les revendications de ce brevet nous donnent une idée de la façon dont Google pourrait suivre la façon dont les chercheurs interagissent avec les résultats de recherche et les données qui proviennent de ces interactions. Les revendications d'un brevet sont ce que les procureurs de l'USPTO examinent pour décider d'accorder ou non un brevet. Ces affirmations nous parlent d'un « journal de sélection des résultats », et du type d'informations qui peuvent être conservées dans ce journal, et comment elles peuvent être mesurées. J'ai inclus les 5 premières revendications du brevet, car elles sont toutes liées les unes aux autres, et elles donnent un aperçu de ce qu'un moteur de recherche examine lorsque nous effectuons des recherches dessus :
Ce qui est revendiqué est:
1. Un système comprenant : un ou plusieurs ordinateurs et un ou plusieurs dispositifs de stockage sur lesquels sont stockées des instructions qui sont utilisables, lorsqu'elles sont exécutées par le ou les journal de sélection des résultats, données concernant les interactions des utilisateurs avec les résultats de recherche d'un moteur de recherche Internet pour plusieurs utilisateurs, chaque entrée de journal dans le journal de sélection des résultats pour une interaction réelle étant spécifique à une interaction et comprenant des données identifiant un utilisateur respectif, une requête soumise par l'utilisateur, un ou plusieurs résultats de recherche présentés par le moteur de recherche en réponse à la requête, un document sélectionné par l'utilisateur parmi les résultats de recherche, une position ordinale dans un ordre de présentation des résultats de recherche du résultat de recherche sélectionné par l'utilisateur , un temps que l'utilisateur a passé sur le document, une langue employée par l'utilisateur et un pays où l'utilisateur se trouve probablement, dans lequel les entrées de journal incluent des entrées identifiantplusieurs utilisateurs, plusieurs documents, plusieurs langues et plusieurs pays ; déterminer à partir des entrées de journal dans le journal de sélection des résultats (i) des fractions de clic pondérées pour chacune des multiples paires de requête-document, (ii) des fractions de clic pondérées pour chacune des multiples paires de requête-document-langue, et (iii) pondérée- fractions de clic pour chacune des multiples paires requête-document-langue-pays, chaque fraction de clic pondérée étant basée sur la somme d'un nombre pondéré de documents sélectionnés par l'utilisateur, et chaque pondération étant basée sur le temps que l'utilisateur a passé sur le document; et modifier un score de récupération d'informations dans le moteur de recherche Internet pour un document spécifique en appliquant l'une des fractions de clic pondérées ou une transformation de l'une des fractions de clic pondérées au score de récupération d'informations pour le document spécifique.
2. Système selon la revendication 1, dans lequel le temps que l'utilisateur a passé sur le document est mesuré comme le temps écoulé entre un clic initial sur le résultat du document jusqu'à ce que l'utilisateur revienne aux résultats de recherche présentés par le moteur de recherche et sélectionne un autre documenter le résultat.
3. Système selon la revendication 1, dans lequel les données de journal comprennent également pour chacune des multiples présentations de résultats de recherche par le moteur de recherche : si un résultat de document a été présenté à l'utilisateur respectif mais n'a pas été sélectionné, les positions respectives d'une ou plusieurs sélections dans une interface utilisateur de présentation de résultats de recherche, des scores d'extraction d'informations de documents sélectionnés, des scores d'extraction d'informations de tous les documents affichés avant un document sélectionné, et des titres et des extraits affichés à un utilisateur avant que l'utilisateur ne sélectionne un document.
4. Système selon la revendication 1, dans lequel les opérations comprennent en outre : l'attribution de poids inférieurs aux fractions de clic sur la base des utilisateurs qui sélectionnent presque toujours le résultat le mieux classé des poids inférieurs aux fractions de clic sur la base des utilisateurs qui sélectionnent le plus souvent les résultats les plus bas dans le classement en premier dans les fractions de clics pondérés.
5. Système selon la revendication 1, dans lequel les opérations comprennent en outre : la classification de sélections individuelles de résultats de documents en deux ou plusieurs catégories de temps de visualisation et l'attribution de poids aux sélections individuelles sur la base de la classification, les catégories de temps de visualisation comprenant une catégorie pour un clic court et une catégorie pour un clic long.
Ce brevet apporte également quelques rebondissements à ce qui y est appelé « techniques traditionnelles de classement ». Il parle du classement basé sur une combinaison d'un score de recherche d'informations et d'un score d'autorité utilisant le PageRank, mais il s'appuie sur le PageRank, en examinant des liens vers des pages de liens à partir d'autres documents pertinents :
Le moteur de recherche peut comprendre un moteur de classement pour classer les documents liés à la requête de l'utilisateur. Le classement des documents peut être effectué en utilisant des techniques traditionnelles pour déterminer un score de recherche d'informations (IR) pour des documents indexés en raison d'une requête donnée. La pertinence d'un document particulier concernant un terme de recherche particulier ou d'autres informations fournies peut être déterminée par toute technique appropriée. Par exemple, le niveau général de liens retour vers un document qui contient des correspondances pour un terme de recherche peut être utilisé pour déduire la pertinence d'un document. En particulier, si un document est lié (par exemple, est la cible d'un lien hypertexte) par de nombreux autres documents pertinents (par exemple, des documents qui contiennent également des correspondances pour les termes de recherche), on peut en déduire que le document cible est particulièrement pertinent. Cette déduction peut être faite parce que les auteurs des documents de pointage pointent vraisemblablement, pour la plupart, vers d'autres documents qui sont pertinents pour leur public.
Si les documents de pointage sont à leur tour la cible de liens provenant d'autres documents pertinents, ils peuvent être considérés comme plus pertinents, et le premier document peut être considéré comme particulièrement pertinent car il est la cible de documents pertinents (voire très pertinents). Une telle technique peut être le déterminant de la pertinence d'un document ou l'un de plusieurs déterminants. La technique est illustrée dans le GOOGLE.RTM. Système de PageRank, qui traite un lien d'une page Web à une autre comme une indication de qualité pour cette dernière page, de sorte que la page avec le plus d'indicateurs de qualité l'emporte. Des techniques appropriées peuvent également être utilisées pour identifier et éliminer les tentatives de faux votes pour augmenter artificiellement la pertinence d'une page.
Le brevet introduit également un moteur de modification de classement, qui examine également d'autres moyens de mesurer la pertinence.
Pour améliorer encore ces techniques traditionnelles de classement de documents, le moteur de classement peut recevoir un signal supplémentaire d'un moteur de modification de classement pour aider à déterminer un classement approprié pour les documents. Le moteur de modification de classement fournit une ou plusieurs mesures de pertinence pour les documents, qui peuvent être utilisées par le moteur de classement pour améliorer le classement des résultats de recherche fourni à l'utilisateur. Le moteur de modification de rang peut effectuer une ou plusieurs des opérations décrites plus en détail ci-dessous pour générer la ou les mesures de pertinence.
Le moteur de recherche peut transmettre la liste de résultats finale classée dans un signal de résultats de recherche côté serveur via le réseau. En sortant du réseau, un signal de résultats de recherche côté client peut être reçu par le dispositif client où les résultats peuvent être stockés dans la RAM et/ou utilisés par le processeur pour afficher les résultats sur un dispositif de sortie pour l'utilisateur.
Fonctionnalités sur lesquelles un moteur de notation peut classer les résultats
- Fonctionnalités basées sur le contenu qui lient une requête aux résultats du document
- fonctionnalités indépendantes des requêtes qui indiquent généralement la qualité des résultats des documents
- Un composant de suivi peut être utilisé pour enregistrer des informations concernant les sélections d'utilisateurs individuels des résultats présentés dans le classement. Par exemple, le composant de suivi peut être un code JavaScript intégré inclus dans un classement de page Web qui identifie les sélections d'utilisateurs (clics) de résultats de documents individuels et identifie également le moment où l'utilisateur revient à la page de résultats, indiquant ainsi le temps que l'utilisateur a passé à visualiser le résultat du document sélectionné.
Suivi des taux de clics des utilisateurs

Suivre les taux de clics des utilisateurs signifie examiner de nombreuses informations telles que les entrées de journal qui indiquent, pour chaque sélection d'utilisateur :
- La requête (Q)
- Le document (D)
- L'heure (T) sur le document
- La langue (L) employée par l'utilisateur
- Le pays (C) où se trouve probablement l'utilisateur (par exemple, en fonction du serveur utilisé pour accéder au système IR)
- Informations négatives, telles que le fait qu'un résultat de document a été présenté à un utilisateur, mais n'a pas été cliqué
- Position(s) du ou des clic(s) dans l'interface utilisateur
- Scores IR des résultats cliqués
- Scores IR de tous les résultats affichés avant le clic
- Les titres et extraits présentés à l'utilisateur avant le clic
- Le cookie de l'utilisateur
- ag cookie
- Adresse IP (Internet Protocol)
- Agent utilisateur du navigateur, etc.
- Informations similaires pour des sessions entières de chercheurs, enregistrant potentiellement ces informations pour chaque clic qui se produit à la fois avant et après un clic en cours
Toutes ces informations utilisateur des journaux de sélection des résultats peuvent être utilisées pour améliorer ultérieurement les résultats d'autres chercheurs.
Ce brevet décrivait également des moteurs de recherche permettant de suivre les informations sur les clics même après un clic sur des requêtes spécifiques. Les éléments énumérés ci-dessus pourraient être suivis, ainsi que les visites d'autres ensembles de documents et résultats de recherche, y compris le temps entre les documents. Le temps passé sur des documents spécifiques peut être classé comme étant des vues plus longues ou des vues plus courtes, les vues plus longues étant une indication générale de la qualité d'un clic dans le résultat de la recherche.
Que peuvent signifier les différents temps d'affichage sur une page ?
Le brevet sur les taux de clics des utilisateurs fournit des détails spécifiques sur ce que différentes longueurs de visualisation peuvent signifier :
Par exemple, un clic court peut être considéré comme indicatif d'une mauvaise page et donc donné un faible poids (par exemple, -0,1 par clic), un clic moyen peut être considéré comme indicatif d'une page potentiellement bonne et donc se voir attribuer un poids légèrement plus élevé (par exemple , 0,5 par clic), un clic long peut être considéré comme indicatif d'une bonne page et donc se voir attribuer un poids beaucoup plus élevé (par exemple, 1,0 par clic), et le dernier clic (où l'utilisateur ne revient pas à la page principale) peut être considéré comme probablement indicatif d'une bonne page et donc donné un poids assez élevé (par exemple, 0.9). Notez que la pondération des clics peut également être ajustée en fonction des informations de clic précédentes.
Plutôt que d'examiner uniquement les durées, des informations supplémentaires concernant les taux de clics des utilisateurs peuvent également être prises en compte :
Les différents délais utilisés pour classer les clics courts, moyens et longs, et les pondérations à appliquer peuvent être déterminés pour un moteur de recherche donné en comparant les données historiques des journaux de sélection des utilisateurs avec des commentaires explicites générés par l'homme sur la qualité des résultats de recherche pour divers requêtes, et le processus de pondération peut être ajusté en conséquence.
Comment les mauvaises données peuvent être protégées contre
Nous avons entendu des porte-parole de Google nous dire que les taux de clics des utilisateurs ne sont pas utilisés pour les classements, et ce brevet nous explique comment les informations de retour d'informations des utilisateurs peuvent être utilisées de manière plus sûre :
Notez que des mesures de protection contre les spammeurs (utilisateurs qui génèrent des clics frauduleux dans le but d'augmenter certains résultats de recherche) peuvent être prises pour garantir que les données de sélection de l'utilisateur sont significatives, même lorsque très peu de données sont disponibles pour une requête donnée (rare). Ces garanties peuvent inclure l'utilisation d'un modèle d'utilisateur qui décrit comment un utilisateur doit se comporter au fil du temps, et si un utilisateur ne se conforme pas à ce modèle, ses données de clic peuvent être ignorées. Les sauvegardes peuvent être conçues pour atteindre deux objectifs principaux : (1) assurer la démocratie dans les votes (par exemple, un seul vote par cookie et/ou IP pour une paire requête-URL donnée), et (2) supprimer entièrement les informations provenant de les cookies ou les adresses IP qui ne semblent pas naturels dans leur comportement de navigation (par exemple, répartition anormale des positions de clic, durées de clic, clics_par_minute/heure/jour, etc.). Les clics suspects peuvent être supprimés et les signaux de clic pour les requêtes qui semblent être spammés n'ont pas besoin d'être utilisés (par exemple, les requêtes pour lesquelles les clics présentent la distribution des agents utilisateurs, les âges des cookies, etc. qui ne semblent pas normaux).
Pertinence déterminée à partir de la durée des vues
On nous dit que le nombre de fois où les visiteurs peuvent consulter les résultats peut être une indication de la pertinence de trouver une page. L'expression « biais de présentation » est utilisée pour décrire comment cela pourrait fonctionner
Le biais de présentation comprend divers aspects de la présentation, tels qu'un titre ou un extrait attrayant fourni avec le résultat du document, et où le résultat du document apparaît dans le classement présenté (position). Notez que les utilisateurs ont tendance à cliquer sur les résultats avec de bons extraits, ou qui sont plus élevés dans le classement, quelle que soit la pertinence réelle du document par rapport à la requête par rapport aux autres résultats. En évaluant la qualité d'un résultat de document donné pour une requête donnée, indépendamment des autres résultats de document pour la requête donnée, cette mesure de pertinence peut être relativement insensible aux biais de présentation.
La requête utilisée peut indiquer un besoin d'information qui peut ne pas nécessiter beaucoup de temps, et qui peut se refléter dans le temps qu'une personne peut passer sur une page. Le brevet fournit quelques exemples impliquant des requêtes de navigation et d'information :
Ainsi, dans le cas de pondération discontinue (et le cas de pondération continue), le(s) seuil(s) (ou formule) de ce qui constitue un bon clic peuvent être évalués sur des bases de requête et spécifiques à l'utilisateur. Par exemple, les catégories de requête peuvent inclure « de navigation » et « informationnelle », où une requête de navigation est une requête pour laquelle une page ou un site cible spécifique est probablement souhaité (par exemple, une requête telle que « BMW »), et une requête d'information est un pour lequel de nombreuses pages possibles sont également utiles (par exemple, une requête telle que "George Washington's Birthday"). Notez que ces catégories peuvent également être divisées en sous-catégories, telles que informationnelle-rapide et informationnelle-lente : une personne peut n'avoir besoin que d'un peu de temps sur une page pour rassembler les informations qu'elle recherche lorsque la requête est " George Washington's Birthday », mais ce même utilisateur peut avoir besoin de beaucoup plus de temps pour évaluer un résultat lorsque la requête est « Hilbert transform tutorial ».
Ce brevet nous explique également comment des éléments tels que le temps de pause peuvent également être pris en compte en ce qui concerne le comportement des utilisateurs :
Les catégories de requêtes peuvent être identifiées en analysant les scores IR ou les retours implicites historiques fournis par les fractions de clic. Par exemple, un biais important dans l'un ou l'autre de ces documents (ce qui signifie qu'un seul ou quelques documents sont très préférés par rapport aux autres) peut indiquer qu'une requête est de navigation. En revanche, des modèles de clics plus dispersés pour une requête peuvent indiquer que la requête est informative. En général, une certaine catégorie d'une requête peut être identifiée (par exemple, de navigation), un ensemble de telles requêtes peut être localisé et extrait des données de clic historiques, et une analyse de régression peut être effectuée pour identifier une ou plusieurs caractéristiques indiquant ce type de requête (par exemple, temps de séjour moyen pour les requêtes de navigation par rapport à d'autres catégories de requêtes ; le terme « temps de séjour » fait référence au temps passé à afficher un résultat de document, également connu sous le nom de temps de séjour du document).
Différents types et modèles d'utilisateurs et clics
Ce brevet va également au-delà de la simple observation des taux de clics des utilisateurs pour voir comment les informations sur les différents utilisateurs peuvent être identifiées en fonction de la vitesse à laquelle ils cliquent et de ce sur quoi ils cliquent. Je soupçonne que ce qu'on nous dit ici n'est que quelques exemples et que d'autres observations ont été trouvées qui peuvent indiquer d'autres moyens utiles d'interpréter de tels clics :
Les types d'utilisateurs peuvent également être déterminés en analysant les modèles de clics. Par exemple, les utilisateurs avertis en informatique cliquent souvent plus rapidement que les utilisateurs moins expérimentés, et les utilisateurs peuvent donc se voir attribuer différentes fonctions de pondération en fonction de leur comportement de clic. Ces différentes fonctions de pondération peuvent même être entièrement spécifiques à l'utilisateur (un groupe d'utilisateurs avec un membre). Par exemple, la durée moyenne des clics et/ou la fréquence des clics pour chaque utilisateur peuvent être déterminées, et le ou les seuils pour chaque utilisateur peuvent être ajustés en conséquence. Les utilisateurs peuvent également être regroupés en groupes (par exemple, en utilisant un algorithme de regroupement K signifie) en fonction de divers modèles de comportement de clic.
De plus, la pondération peut être ajustée en fonction du type d'utilisateur déterminé, à la fois en termes de traduction de la durée du clic en bons clics par rapport à des clics moins bons, et en termes de poids à accorder aux bons clics d'un groupe d'utilisateurs particulier par rapport à un autre groupe d'utilisateurs. Les commentaires implicites de certains utilisateurs peuvent être plus précieux que ceux d'autres utilisateurs en raison des détails du processus de révision d'un utilisateur. Par exemple, un utilisateur qui clique presque toujours sur le résultat le mieux classé peut se voir attribuer un poids inférieur à ses bons clics qu'un utilisateur qui clique plus souvent sur des résultats plus bas dans le classement en premier (puisque le deuxième utilisateur est probablement plus discriminant dans son évaluation de ce que constitue un bon résultat). En outre, un utilisateur peut être classé en fonction de son flux de requêtes. Les utilisateurs qui émettent de nombreuses requêtes sur (ou liées à) un sujet T donné (par exemple, des requêtes liées à la loi) peuvent être présumés avoir un haut degré d'expertise concernant le sujet T donné, et leurs données de clic peuvent être pondérées en conséquence pour d'autres leurs requêtes sur (ou liées à) le sujet donné T.
Brevets de taux de clics des utilisateurs par Hyung-Jin Kim
L'un des inventeurs du brevet dont je parle aujourd'hui est Hyung-Jin Kim. J'ai déjà rencontré son nom.
Un article de blog intéressant d'AJ Kohn sur un brevet qu'il a co-inventé mérite également d'être examiné. Est-ce que le taux de clics est un signal de classement ?.
Un autre article qui concerne un brevet du même inventeur est celui que j'ai écrit, intitulé Utilisation des données utilisateur des requêtes pour classer les requêtes. Hyung-Jin Kim n'est pas le seul ingénieur de recherche Google à écrire sur les taux de clics des utilisateurs.
J'ai également vu quelques brevets de Navneet Panda (oui celui dont la mise à jour Google Panda porte le nom) qui a écrit sur la possibilité que Google apprenne des taux de clics des utilisateurs et du comportement des utilisateurs, ce qui peut influencer les classements de recherche
J'ai également écrit l'article The Long Click and the Quality of Search Success couvrant un brevet qui examinait le temps qu'une personne pouvait passer sur une page comme indication de la qualité de cette page. Il semble que le clic long soit une métrique à laquelle les gens de Google accordent beaucoup d'attention, qui est étroitement liée aux taux de clics des utilisateurs.

