搜索者行为数据的机器学习消歧

已发表: 2021-10-23

搜索引擎可以从搜索者行为数据中学到什么?

该专利是关于改进计算机的工作。

搜索者动作数据可以代表金融交易。 信用卡对帐单可能包括有关特定信用卡的金融交易数据。

此搜索者操作数据可能包括:

  • 一个约会
  • 描述
  • 与特定金融交易相对应的金额

金融交易数据 [“4/12/2013”​​、“ITALIAN DELI NEW YORK NY”、“12.08”] 可能代表 2013 年 4 月 12 日在位于“Italian Deli”的交易的信用卡费用为 12.08 美元在纽约,纽约

该专利涉及有关许多实体类型的搜索者操作数据。 该过程需要使用基于机器学习的注释器来:

  • 识别实体
  • 注释搜索者操作数据
  • 接收来自搜索者的查询
  • 查询搜索者动作数据
  • 从搜索者操作数据生成查询的答案
  • 回答查询

该系统可以接收由特定搜索者获取的关于多种实体类型的实体的数据。 由于无法确定实体,因此大多数实体的数据被确定为不明确的。 系统消除表示特定搜索者针对多种实体类型的实体采取的动作的信息的歧义。

从搜索者操作数据中消除了哪些歧义?

消除歧义可以包括识别为被确定为不明确的大多数实体指定的实体。 它将使用经过训练的基于机器学习的注释器来识别数据中的实体和实体属性。 它还将用各自的实体标识符注释表示有关许多实体类型的实体的搜索者操作数据的数据。

系统接收特定于特定搜索者的查询。 该问题包括陈述实体的第一实体类型和搜索者针对实体采取的行动的术语。 系统确定第一实体类型的实体并查询表示搜索者针对第一实体类型的实体采取的动作的数据。 系统从代表特定搜索者针对第一实体类型的实体采取的动作的信息生成对查询的回答,并提供对特定搜索者特有的问题的回答。

这些数据被视为搜索者行为数据,例如金融交易数据。 系统可以接收代表金融交易的搜索者动作数据。 搜索者操作数据可能包括:

  • 信用卡交易数据
  • 借记卡交易数据
  • 财务报表交易数据

系统可以分析金融交易数据以提供关于金融交易的信息。 例如,系统可以对金融交易进行分类以查看搜索者在特定类别中花费的金额或百分比。 类别可以包括“餐厅”,并且系统可以将餐厅“Italian Deli”的金融交易编入餐厅的索引,因为相应的搜索者行为数据由“Deli”一词组成。 但是,金融交易数据可能会变得更加模糊。 例如,金融交易数据 [“4/11/2013”​​、“BEST R NEW YORK NY”、“45.78”] 可能变得不清楚。

消除金融交易数据的歧义

为了消除金融交易数据的歧义,系统可以使用基于机器学习的注释器来识别与金融交易数据相关联的实体。 实体可以是商业实体,例如:

  • 特定的商店
  • 餐厅
  • 办公室
  • 公司

例如,基于机器学习的注释器可以识别位于纽约州纽约市的“最佳餐厅”实体,它与金融交易数据相关联。

基于标记训练数据的关联

基于机器学习的注释器可以接受训练以基于标记的训练数据识别与搜索者动作数据相关联的实体。 例如,基于机器学习的注释器可以接受培训以确定金融交易数据,包括位置,例如“纽约纽约”、“DC”或“90210”,可能与与领域。

并且,可以训练基于机器学习的注释器来确定单个字母,例如“R”,可能是以实体名称中的字母开头的单词的缩写。 基于机器学习的注释器可以基于“NEW YORK NY”、“BEST”和“R”的存在来确定金融交易数据与位于纽约州纽约市的名为“Best Restaurant”的实体相关联

此外,基于机器学习的注释器可能只接受培训以分析金融交易数据中的描述或分析金融交易数据中的更多信息,例如金额和日期。 例如,基于机器学习的注释器还可以基于考虑金额和日期来确定与“最佳餐厅”相关联的金融交易。 注释者可以选择 45.78 美元的金额与在“最佳餐厅”餐厅花费的金额一致,并且作为金融交易的一方的搜索者于 2013 年 4 月 11 日在纽约州纽约市,基于搜索者的个人资料。

搜索者操作数据,即非金融交易数据

该专利还告诉我们,用于训练基于机器学习的注释器的标记训练数据可能包括文本和识别为与文本相关联的实体。 例如,基于机器学习的注释器可以使用“最佳餐厅”网站的摘录来准备,这些摘录被识别为与实体“最佳餐厅”相关联。 标记的训练数据可能包括其他非金融交易数据,例如:

  • 来自评论网站的文本,与已识别的实体相关联
  • 搜索者的社交网络互动
  • 搜索者使用的搜索词
  • 搜索者提供的训练数据包括明确确认识别的实体是正确还是不正确

此外,标记的训练数据可以包括与识别的实体相关联的金融交易数据。 例如,标记的训练数据可能包含代表餐厅金融交易的金融交易,包括“最佳餐厅”。

系统可以将金融交易与由基于机器学习的注释器识别的实体相关联。 该方法可以用包括代表所识别实体的标识符的数据来注释金融交易数据。 例如,系统可以用实体标识符“00542687”来注释金融交易数据[“4/11/2013”​​、“BEST R NEW YORK NY”、“45.78”]以产生带注释的金融交易数据[“4/ 11/2013”​​、“BEST R NEW YORK NY”、“45.78”、“00542687”] 其中“00542687”是实体“Best Restaurant”的唯一标识符。

系统可以存储关于实体的实体数据

系统可以存储关于实体的实体数据。 例如,餐厅实体的实体数据可能包括:

  • 餐厅名称
  • 地址
  • 电话号码
  • 小时
  • 用餐风格
  • 菜式
  • 行政总厨姓名
  • 价格范围

服装店的实体可能包括:

  • 一个店名
  • 服装类型
  • 目标听众
  • 小时
  • 价格范围

其他类型的实体可能包括其他属性的不同值。

搜索者操作数据可以提供有关金融交易的信息

使用带注释的金融交易数据,系统可以提供关于金融交易的信息。 例如,如果搜索者请求系统识别搜索者在 2013 年 4 月 11 日在哪家餐厅吃饭,则系统可以基于注释的金融交易数据识别 4 月的金融交易。 2013 年 1 月 11 日,并且与实体餐厅相关联并返回餐厅的结果“最佳餐厅”。

本专利中描述的主题可能包括关于特定金融交易的详细金融交易数据。 它可以将特定的金融交易数据提供给识别与金融交易数据相关联的实体的基于机器学习的注释器。 更多的动作可能包括将特定的金融交易与由基于机器学习的注释器为详细金融数据识别的实体相关联。

并且,本说明书中描述的主题可以体现在方法中,这些方法可以包括从作为特定金融交易的一方的搜索者接收查询并确定与该问题相关联的实体类型的动作。 更多的度量可以包括确定与特定金融交易相关联的实体与与查询相关联的实体类型相匹配。 进一步的动作可以包括响应于查询提供标识实体的答复。

其他版本包括相应的系统、装置和计算机程序,被配置为执行在计算机存储设备上编码的方法的动作。

其他类型的金融交易

这些和其他版本可能各自包括以下功能。 金融交易数据可能包括:

  • 信用卡交易数据
  • 借记卡交易数据
  • 财务报表交易数据

在某些方面,将特定金融交易与由基于机器学习的注释器识别的实体相关联可以包括用代表所识别实体的标识符来注释特定金融交易数据。

动作可以包括从基于机器学习的注释器接收识别候选实体的数据,并基于作为特定金融交易的一方的搜索者的搜索者简档从所识别的候选实体中选择与特定金融交易相关联的实体。

基于搜索者简档从候选实体中选择与特定金融交易相关联的实体可以包括确定,在金融交易数据指示的日期,搜索者简档建议搜索者位于与实体。

搜索者数据专利的机器学习消歧

基于机器学习的注释器使用标记的训练数据进行训练。

获得专利的搜索者操作数据流程中的操作可能包括:

  • 接收来自作为特定金融交易一方的搜索者的查询
  • 确定与查询关联的实体类型
  • 确定与特定金融交易相关联的实体与与查询相关联的实体类型相匹配
  • 作为对查询的响应,提供标识实体的响应

专利在这里:

搜索者行为数据的机器学习消歧
通风口:马修考恩
受让人:谷歌有限责任公司
美国专利:11,151,198
授予:2021 年 10 月 19 日
提交时间:2020 年 1 月 22 日

抽象的

方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于接收表示特定搜索者针对多种实体类型的实体采取的动作的数据,通过使用机器识别数据中指定的实体来消除数据歧义基于学习的注释器接受训练以识别实体并注释数据,从特定搜索者接收特定于查询的查询,查询表示特定搜索者采取的行动的数据,根据表示采取的行动的数据生成查询的答案由特定搜索者提供,并提供查询的答案。