谷歌更新了他们的 One Box 专利

已发表: 2017-05-04

杰克逊维尔美洲虎

一项关于 Google Oneboxes 的延续专利显示了用户体验数据如何在确定一组搜索结果中是否出现 onebox 方面发挥更大的作用,包括用于事实存储库查询的 onebox,例如精选片段

我们对一盒的了解

2007 年,我写了一篇关于 Search Engine Land 的专利,我将其命名为 Google 的单一框专利申请。 该专利告诉我们的是,有时 Google 可能会在一组搜索结果的顶部添加另一个结果,而该额外结果可能来自某些不同的垂直搜索结果或存储库。 如果搜索的查询出现在新闻搜索结果中,则可能会显示新闻结果单框。 如果很多人在图像搜索中查看美洲虎的图像,并且查询是“美洲虎”,那么单框可能包含美洲虎的图片。 如果我从杰克逊维尔搜索,那是在一个充满 NFL 比赛(包括杰克逊维尔美洲虎队的比赛)的周日之后的星期一,那么 onebox 可能包含有关美洲虎队比赛的体育故事。

一盒的变化

谷歌本周从那篇文章中获得了该专利的更新版本,该版本似乎选择了该专利早期版本中描述的众多方法中的一种。 该专利的较新版本是一项延续专利,采用原始版本的申请日期,但更新了权利要求部分以反映其保护的过程是如何被使用的。

在 SearchEngineLand 的帖子中,我写了关于谷歌如何识别和使用某些数据来了解显示结果的存储库。 该专利描述了至少七种不同的方法,可用于确定向搜索者显示什么类型的数据。 其中之一是最有趣的发声方法,所以我在我的帖子中写了它。 延续专利似乎指出这种方法是用于决定存储库的方法:

一种变体描述了收集有关搜索者和存储库搜索的日志数据的过程。 日志数据表示为三元组数据 (u, q, r),其中 u 是有关搜索者的信息,q 是有关查询的信息,而 r 是有关提供搜索结果的存储库的信息。 为每个数据三元组 (u, q, r) 创建标签,其中标签包括有关用户 u 在用户提供搜索查询 q 时是否需要来自存储库 r 的信息的信息。 创建指令以训练基于数据三元组(u、q、r)及其相关标签的模型,以预测特定用户在提供特定搜索查询时是否需要来自特定存储库的信息。

根据用户数据(包括点击次数)为单一框选择的存储库

存储库是专注于搜索某个方面的数据集合,例如基于新闻的搜索、基于图像的搜索、基于本地的搜索。 这些不同类型的搜索有其独特的排名因素和结果。 谷歌告诉我们一个可浏览的基于事实的存储库,其中查询回答类型的结果,如特色片段来自。 有趣的是,Google 很可能会使用用户数据信息来决定显示结果的存储库。 因此,当有人决定点击某个结果时 - 像这样的点击可以决定其他人看到什么,谁选择了相同的查询进行搜索

新版专利中的声明值得一看,例如谷歌描述的过程的更新和受保护版本。 通过查看声明的旧版本和最新版本并查看已删除和添加的内容,可以尝试了解可能发生的更改。 对我来说,立即突出的一件事是新版本索赔中的以下几行:

4.如权利要求1所述的方法,其中,在搜索结果文档中提供所述信息,并且所述方法包括: 在所述搜索结果文档中,基于所述多个存储库中的一个以上的每个存储库的相应分数来定位所述信息。的存储库。

5.如权利要求1所述的方法,还包括: 基于与日志数据相关联的信息生成所述模型,与所述日志数据相关联的信息以三元组形成。

我认为专利描述中讨论查询日志数据的部分,以三元组数据的形式呈现,以预测在搜索某个查询时需要从哪些存储库中获取哪些信息,当我在 2007 年读到它时很有趣。看来最新版本的声明侧重于查看用户数据,以预测从哪个存储库向搜索者显示哪些信息。

该专利的较新版本位于:

确定检索搜索结果所需的存储库
发明人:Michael Angelo、David Braginsky、Jeremy Ginsberg 和 Simon Tong
受让人:GOOGLE
美国专利 9,639,579
授予时间:2017 年 5 月 2 日
提交时间:2015 年 7 月 27 日

抽象的

系统从用户接收搜索查询并基于搜索查询搜索一组储存库,以针对每个储存库识别一组搜索结果。 该系统还基于用户希望来自所识别的储存库的信息的可能性来识别储存库中的一个并呈现与所识别的储存库相关联的搜索结果集。

外卖

通过对这项专利的更新,似乎 Google 可能会使用我在 2007 年第一次撰写该专利时所描述的点击实例中指出的用户数据类型,从这些项目开始:

  • 用户所在的国家,
  • 用户 u 所在国家的语言,
  • 与用户 u 相关联的 cookie 标识符,
  • 查询q的语言,
  • 查询 q 中的每个术语,
  • 用户 u 提供查询 q 的时间,存储库 r 中呈现给用户 u 的文档,

这只是谷歌可能收集的数据类型的开始,用于构建预测模型,以确定在搜索结果顶部显示哪个存储库的信息。