Google 如何选择 How-to 查询的答案
已发表: 2020-03-12Google 如何响应 How-To 查询
https://gofishdigital.com/google-how-to-queries/
谷歌已经发布了一项关于他们如何处理 how-to 查询的专利
请务必阅读 Google 开发人员关于如何使用 HowTo 结构化数据的页面,以获取有关 Google 如何建议开发人员实施 How-to Structured Markup 的具体信息。 该页面为我们定义了 How-to 标记的目的:
操作指南会引导用户完成一组步骤来完成任务,并且可以展示视频、图像和文本。 例如,“如何系领带”或“如何为厨房后挡板铺瓷砖”。 如果必须按顺序阅读 howto 中的每个步骤,这是一个好迹象,表明 HowTo 结构化数据可以使您的内容受益。 当 how-to 是页面的主要焦点时,HowTo 结构化数据是合适的。
谷歌已获得一项关于“How-to”查询的专利,看起来值得分享以炫耀他们可能会考虑炫耀 How-to 查询的答案。
正如专利的描述立即告诉我们的那样:
本规范通常旨在提供基于对许多来源的分析来完成任务的分步说明。
开发者的页面没有包含专利包含的一些信息,它告诉我们谷歌如何分析许多来源以提供“基于对这些来源的分析完成任务的分步说明”。
这是响应 Google 的 how-to 查询过程背后的 How-to:
- 可以识别与执行任务相关的操作方法查询和与操作方法查询相关的源
- 可以确定可以使用户能够执行任务的步骤
- 步骤的确定可以基于对与 how-to 查询相关的来源的分析
- 可以确定来源的置信度
- 这些步骤可能与数据库中的 how-to 查询相关联
- 可以响应搜索者提交的操作方法查询(或类似查询)向搜索者提供这些步骤
- 对与 how-to 查询相关的来源的分析可以包括比较不同步骤集的组件和识别共同元素以确定步骤集
更详细地说,how-to 查询过程的步骤包括:
- 确定与执行任务相关的操作方法查询
- 识别响应 how-to 查询的源
- 确定多个已识别来源中的一个或多个的置信度量,给定来源的置信度量指示给定来源在为如何查询的任务提供步骤方面的有效性
- 根据已识别来源的置信度确定执行任务的步骤
- 将步骤与操作方法查询相关联并存储响应操作方法查询而提供的步骤
此过程背后的一些附加功能可能包括:
在查找来源时,一个可能是用户手册,并且该用户手册可被视为来源之一。 执行任务的一组步骤可以基于用户手册。
How-to 查询中响应背后的步骤
响应 how-to 查询的方法可能进一步涉及:
- 从多个来源确定步骤
- 识别每组步骤中的步骤
- 根据这些步骤确定执行任务的步骤
- 确定来自源的步骤之间的相似性度量
- 根据相似性度量确定要显示的步骤
相似性度量可以基于:
- 关键字匹配
- 词组匹配
- 解析树匹配
- 分布相似度分数
- 编辑距离分数
在一些实施方式中,该方法还可以包括:
- 为每组步骤中的每个步骤确定一个表示该步骤置信度的相关性分数
- 根据相关性分数从一组步骤中识别一个或多个步骤
如何在 How-To 查询响应中选择步骤
可以基于源的置信度度量从源中选择所示出的执行任务的步骤。
一个来源的置信度量可能基于:
- 给定来源的排名
- 访问给定来源的频率
- 给定来源的链接数
- 给定来源的凝聚力
- 与给定来源相关的用户反馈
可以为响应于提交的查询而提供的一组步骤确定质量度量。
还可以基于搜索者的查询表明希望接收用于完成由查询所指示的任务的步骤的置信度来为提交的查询确定查询分数; 并且决定显示响应查询的步骤将满足搜索者的需要。
该方法还可以包括:
- 确定执行任务所需的一项或多项技能水平
- 执行任务的持续时间
- 执行任务所需的工具列表
- 执行任务所需的材料清单。
可以在以下位置找到有关响应操作方法查询的专利:
确定响应 how-to 查询的一组步骤
发明人:Kerwell Liao、Nikhil Sharma、LaDawn Risenmay Jentzsch 和 Jennifer Ellen Fernquist
受让人:GOOGLE LLC
美国专利:10,585,927
授予时间:2020 年 3 月 10 日
提交时间:2017 年 3 月 2 日
抽象的
与基于对多个来源的分析提供用于完成任务的步骤相关的方法和装置。 可以识别与执行任务相关的操作方法查询和与操作方法查询相关的多个源。 与执行任务相关的一组步骤可以基于与如何查询相关的多个源的分析来确定,可选地包括确定多个源的置信度度量。 该组步骤可以与数据库中的操作方法查询相关联。 该组步骤可以响应于用户提交的操作方法查询而提供给用户。 在一些实施方式中,对与操作方法查询相关的多个源的分析可以包括比较不同步骤集合的组件并识别共同元素以确定步骤集合。
How-to 查询中的任务术语和查询术语
该专利指出了他们所称的任务术语和查询术语的一些示例:
- “如何从衣服中去除焦油”是一个操作方法查询,其中包括任务术语(“从衣服中去除焦油”),用于识别从衣服中去除焦油的任务,并包括表示希望从衣服中去除焦油的查询术语(“如何”)可用于去除衣服上的焦油的信息。
- “我如何更换汽车轮胎”是一个操作方法查询,包括识别更换汽车轮胎任务的任务术语(“更换汽车轮胎”)并包括指示需要可用于更换汽车轮胎的信息。
Google 如何识别 How-to 查询
1. 关键术语或关键短语的使用——这些可能包含在查询中。 例如,查询的前缀可以与一个或多个查询词匹配,例如:
- “如何”
- “我如何”
- “怎么样”
- “有人知道吗”
- “我在哪里可以找到指示”
- “我在哪里可以得到指示”
- “谁能告诉我”
- “教我”
- “告诉我怎么做”
- “如何”
- “在哪里”
- “指示”
- “?”
2. 使用带有查询词的前缀和该前缀后面的附加词,这可能涉及将查询词与查询词匹配以及将查询词与任务词匹配。 例如:
- 查询“更换漏气的轮胎?” 基于术语“更换漏气轮胎”与任务短语“更换漏气轮胎”的匹配以及术语“?”的匹配,可以将其识别为操作方法查询。 到查询词“?”
- 查询“remove tar instructions”可以基于术语“remove tar”与任务短语“removing tar”的匹配以及术语“instructions”与查询术语“instructions”的匹配而被识别为how-to查询

3.可以使用查询词与查询词和/或任务词之间的精确匹配和/或软匹配。
可以经常包括在操作方法查询中的关键术语和关键短语(包括任务术语和/或查询术语)可以存储在内容数据库中。
任务术语可以根据以下条件确定:
- 词性标注
- 语义分析
- 句法分析
- 其他技术
4. 查询中包含的查询词和任务词的频率可用于确定查询是否为操作方法查询。

与查询中的关键术语的频率和/或跨另一文档语料库的频率相关的数据可以可选地存储在内容数据库中并且用于确定查询是如何做的查询。
- 如果任务术语“从头开始制作蛋糕”在过去的查询中出现的频率至少达到阈值水平,则“如何从头开始制作蛋糕”可能仅被标识为操作方法查询。
5. 提交查询的频率可用于决定查询是否为操作方法查询。
该频率可以存储在内容数据库中。 如果已以至少阈值频率水平提交查询,则可以将查询标识为操作方法查询。
- “我如何从头开始制作蛋糕”可以被视为一个如何查询,如果它及其变体在过去的几个查询中满足查询的阈值级别。
6. 类似的 how-to 查询可能会相互关联
I相似的how-to查询之间的关联可以存储在内容数据库中。 类似的 how-to 查询是表示需要信息来执行类似任务的查询,例如:
- “如何去除衣服上的焦油”
- “我怎样才能去除衣服上的焦油?”
- “如何去除织物上的焦油”
- “去除焦油污渍”
- “染色克星-焦油”
可以通过比较各自的查询术语和/或来自它们的任务术语来识别类似的操作方法查询。
7. 与 how-to 查询相关的搜索结果和/或搜索结果文档的分析
可以分析响应查询的SERP以确定搜索结果是否具有提供与执行由查询标识的任务相关的步骤的文档。
因此,可以分析排名第一的 N 个搜索结果,以查看其中的阈值数量是否包括有关执行由查询标识的任务的步骤。
可以确定那些搜索结果中的页面具有查询的最高选择评级,也可以分析该查询以查看其是否提供关于执行由查询标识的任务的步骤。
8. 类似的查询可能会使用一些额外的方法
这些可能涉及:
- 关键字匹配
- 词组匹配
- 短语的上下文相似度匹配
9.术语之间的相似性可以通过其他方式确定
这些可以包括:
外部资源(如词汇数据库)中术语之间的语义距离或路径长度。 词汇数据库可以包括关键术语和/或短语,包括单词、名词、形容词、动词、副词等以及它们的概念和/或语义相互关系。 在一些实施方式中,可以基于关键术语和/或短语的含义和/或它们与其他关键术语和/或短语的句法关系来对关键术语和/或短语进行分组。 在一些实现中,诸如内容数据库之类的数据库可以包括分布相似的查询词和/或任务词以及它们对应的分布相似度分数。 例如,通常出现在相似上下文中的短语可能被认为具有相似的含义。 例如,在文档集合(例如 HTML 网页)中与与第二短语的单词相同的词共同出现的第一短语可以被认为在分布上与第二短语相似。 将两个或更多个查询标识为相似可以在本文描述的方法的一个或多个步骤中使用。 例如,在确定查询的集体频率是否足够大以构成将此类查询标识为操作方法查询并确定执行由此类查询标识的任务的一组步骤时,可以对查询进行分组。 此外,例如,用于确定步骤集合和/或与此类源相关联的任何排名的源的标识可以基于多个类似查询中的每一个的源的排名。 此外,例如,将一组步骤与如何做查询相关联可以包括将这组步骤与类似的如何做查询相关联。
一些其他类型的操作方法查询
该专利描述了搜索者可能会搜索 How-to 查询的其他一些情况。 这些可以包括:
- 在车辆上安装更换零件
- 安装复杂的软件
- 执行与搜索相关的任务(“我如何在城市中找到新房子?)
- 与地图相关的位置查询
与来源相关的置信度措施
源的置信度度量可以指示该源在提供正确步骤以完成特定操作方法查询方面的有效性。
一个来源的置信度量可能基于:
- 给定源的及时性(指示上次更新源的时间戳。)
- 链接到给定来源的文档数量(表明来源的流行度或权威价值)
- 来自给定源的传出链接数(表示源的全面性。)
- 如果基于传出链接,也可以基于传出链接的选择率
- 分析给定来源的凝聚力
- 给定来源与操作方法查询标识的任务的关联程度
- 锚文本证据(如果页面包含带有锚文本的链接,该链接与页面上涵盖的任务的信息相似。)
- 访问给定来源的频率
- 对给定源的信息噪声比的分析。 这种干扰可能包括 HTML 标签、空白、无关链接、赞助广告或覆盖无关内容的内容
- 为完成 how-to 查询任务提供的步骤数(步骤数越多可能表示全面性。)
- 基于与给定来源相关联的作者和/或出版商(例如,如果操作方法查询与技术任务相关,那么作者和/或出版商是否是此类技术任务的公认权威?)
- 基于作者的来源和作者的属性,例如适当的技术资格和/或经验,以提供与 how-to 查询相关的权威信息)
- 此处讨论的技术可以随意组合
其他方法
- 操作方法查询可以使用在描述如何执行任务的说明手册中找到的答案,并且该手册可能具有最高的置信度度量作为执行任务的步骤的来源
- 一个或多个来源(排名靠前的来源)可用于包括执行任务的步骤,其中一些步骤来自一个来源,一些来自另一个来源
- 一些额外的步骤可能作为可选的
- 某些步骤可能会显示并标记为不太理想
- 信息可以在一段而不是一组步骤中显示
- 自然语言处理技术可用于将段落或其他文本段分割成执行至少一部分任务的步骤

该专利还提供了有关考虑步骤的相似性的信息,这些步骤可能包含在响应操作方法查询的任务完成中,以及有关步骤的相关性分数的信息。 步骤的相关性分数可以部分地基于识别该步骤的源的置信度度量。 因此,来自备受推崇的技术手册的步骤可能具有更高的相关性分数。
一组步骤的相关性分数可以基于识别对应于执行任务所需的一组步骤的步骤的源数量。
完成任务的各个步骤可能基于置信度评级,例如“高置信度”、“中等置信度”。 和“信心不足”。 (基于这些步骤在源中出现的频率,表明一个步骤是必需的步骤。
因此,步骤的相关性可能基于来源的置信度和包括这些步骤的来源数量。
这些步骤必须满足阈值相关性分数才能作为内容数据库中的步骤被包括在内,这些步骤可能来自对 how-to 查询的回答。
如何查询答案的属性
响应于如何查询,与一组步骤相关联的属性可以被识别并与那些步骤一起显示。 示例可以包括:
- 一组步骤的标题(例如,“如何更换汽车轮胎”)
- 技能水平(例如,达到驾驶年龄的人)
- 估计所需时间(例如,二十五分钟)
- 所需工具(例如千斤顶和扳手)
- 执行任务所需的材料
- 与确定的一组步骤相关联的一个或多个来源(例如,用户手册)
- 一个或多个警告声明(例如,将汽车停在水平面上,在轮胎后面放置止动器以防止滚动,应用手制动器)。
源可以包括该组步骤所基于的和/或被识别为符合一个或多个步骤的源。
该专利包括有关可能与步骤相关联的属性的更多详细信息,以及每个步骤的质量度量以及可能与一组步骤相关联的每个属性。
它还告诉我们可能与步骤相关的标签,例如“最佳猜测”和“最高置信度”或“最低置信度”。
How-to 查询要点
我已经包含了这项专利的许多不同方面,但它有很多细节,我没有捕捉到所有内容。
阅读专利以了解推荐的内容,希望这篇文章能让您更轻松地浏览专利。
在专利背后的过程中,我发现非常有趣的一件事是,在比较有关任务的不同信息源以及完成这些任务的步骤方面需要付出多少努力。
我认为这有助于理解为什么某些答案可能比其他答案更好。
