点击熊猫:基于重复点击和访问持续时间的高质量搜索结果
已发表: 2017-06-29
熊猫专利返回新权利要求
三年前,我写了一篇关于谷歌 Navneet Panda 的专利,该专利专注于页面在搜索结果中的排名。 我的帖子是一个总结。 并被称为,谷歌的熊猫授予了排名搜索结果的专利。 上周,我在那篇文章中所写的专利的延续版本被授予了谷歌。 我喜欢延续专利,因为此类专利的权利要求部分会随着其中描述的过程在某些方面发生变化而发生变化。 这些更改通常是 Google 对原始专利中描述的流程进行更改的有趣反映。 这一点表明重复点击很重要。
近年来,我们看到谷歌发生了变化,涉及 Rank Brain 和机器学习等方面,但该专利中的更新似乎与用户与网站的交互有关。 正如我提到的,参与这项专利的发明人之一是 Navneet Panda,他因参与 Google 的 Panda 更新而闻名。 该专利告诉我们它涉及降级低质量页面的搜索结果,这并不奇怪。
我查看了这个新版本专利的声明,并对其工作方式的变化感到惊讶。
该专利侧重于响应查询返回的搜索结果。 它提到了一个基于组的修改因素,它可能会影响查询出现的搜索结果:
一般而言,本说明书中描述的主题的一个创新方面可以体现在包括从客户端设备接收搜索查询的动作的方法中; 接收识别多个搜索结果资源和每个搜索结果资源的各自初始分数的数据; 识别每个搜索结果资源所属的相应资源组; 为每组资源确定相应的基于组的修改因子,并且至少部分地基于搜索结果资源所属的资源组的组特定修改因子来调整每个搜索结果资源的初始分数为每个搜索结果资源生成相应的第二分数。
专利背后的过程
该专利中描述的过程首先确定响应查询而选择的结果是否具有导航性。 如果是,那么专利中描述的过程似乎并没有添加太多关于在搜索结果中选择的站点的信息。
该专利告诉我们有关独特点击和故意访问(来自之前从未点击过特定组中任何资源的搜索结果的用户)以及它如何查看选择生成的特定资源组的重复点击次数所选资源的重复点击率。
如果某人在多次搜索会话中执行搜索并选择相同的资源(可能使用不同的词),这将被视为重复点击,重复点击次数越多,该资源的质量信号就越高——如果有人有目的地返回某个页面(故意访问),这是一个积极的信号,并与其他信号相结合,例如他们在返回搜索之前可能停留的时间。

访问时间的重要性
虽然访问搜索结果的持续时间是我所看到的暗示搜索引擎可能会用作积极信号的东西,但这是我第一次看到它在专利中清楚地说明告诉我们:
特定资源组的平均持续时间度量可以是从给定用户点击包括在搜索结果网页中的搜索结果的时间之间流逝的时间长度的测量数据集计算的统计测量,该搜索结果网页识别给定用户导航回搜索结果网页的特定资源组中的资源和时间。
正如我在 Unraveling Panda Patterns at Moz 中所写的那样,搜索结果中高质量的迹象是一个积极的信号,而低质量资源的迹象可能会导致这些资源在搜索结果中被降级。 该专利告诉我们这样做的好处是:
因此,可以改进用户体验,因为呈现顺序中较高的搜索结果将更好地匹配用户的信息需求。
更新的延续专利是:
对搜索结果进行排名
发明人:Navneet Panda、Vladimir Ofitserov 和 Kaihua Zhu
受让人:谷歌
美国专利:9,684,697
授予日期:2017 年 6 月 20 日
提交时间:2012 年 12 月 31 日
抽象的
用于从客户端设备接收搜索查询的方法、系统和装置,包括编码在计算机存储介质上的计算机程序; 接收识别第一多个搜索结果资源和第一多个搜索结果资源中的每一个的各自初始分数的搜索结果数据; 识别每个搜索结果资源所属的相应资源组; 为每组资源确定相应的基于组的修改因子,并且至少部分地基于搜索结果资源所属的资源组的组特定修改因子来调整每个搜索结果资源的初始分数为每个搜索结果资源生成相应的第二分数。
2014 年授予的较早版本的专利排名搜索结果与此较新版本不同,尤其是在权利要求部分,该部分更详细地讨论了点击次数。
带走
许多 Google 代表告诉我们,点击选择数据往往是嘈杂的,不会用于对搜索结果进行排名,而是可能用于测试 Google 使用的算法。 这个专利也是这样吗? 它似乎是专利中描述的过程如何运作的重要组成部分,值得花一些时间思考。 该专利指向来自登录搜索者的点击,并附有 cookie 或设备 ID。 它有多可靠?
但更重要的是:(1)让人们有理由访问您的网站,以获得您想要排名的内容,以及
(2) 一旦人们来访问您,就给他们一个理由在您的页面上花时间。
