在涉及地理位置查询的 Google 上获得更好的自然搜索结果
已发表: 2017-03-10
谷歌在涉及位置查询的有机搜索结果方面是否做得更好?
我首先开始寻找专利来帮助我建立一个网站,该网站背后的业务位置对于他们在自然搜索结果中开展的业务非常重要。 我当时撰写的专利名为为网页分配地理位置标识符。 谷歌最近获得了一项专利,该专利使网站页面显着位置的位置指示变得非常重要。 我想起了有关地理位置查询的最新专利。
这项新专利提供了一个潜在问题的示例,这些问题可能发生在针对地理位置的搜索中:
一些提供搜索查询的用户对接收引用资源的搜索结果感兴趣,这些资源包括与特定位置相关的信息。 例如,提交搜索查询“亚特兰大家庭活动”的用户可能正在搜索提供有关亚特兰大市信息的网页。 响应于搜索查询“亚特兰大家庭活动”而提供的搜索结果可能包括一个网页,该网页不提供关于亚特兰大甚至亚特兰大市的家庭活动的信息,而仅包括单词 Atlanta。
例如,搜索结果引用的一个资源可以是零售商站点,该站点包括允许用户指定他们当前位置以识别所选位置附近的零售位置的下拉菜单。 另一个资源可以在资源的脚注中包含单词 Atlanta,该资源指定开发网页的公司的营业地点。 尽管上述两种资源都包含文本“亚特兰大”,但这些资源不太可能满足提交“亚特兰大家庭活动”搜索查询的用户的信息需求,因为这些资源提供的有关家庭活动的信息很少亚特兰大市。
这项新专利引入了他们称之为“语义地理标记”的东西。 语义地理标记是“地理位置的标准化表示,包括该地理位置的一个或多个特定于位置的术语。”
这个地理令牌是否提供了足够的信心来证明它是关于特定地点的? 该置信度可以部分地基于在页面上的显着位置提及某个地点的位置。
我们还被告知,这种方法将涉及确保我们对页面上的位置具有足够的特异性,例如指定地理位置的城市和州,因此搜索亚特兰大发生的事情应该在页面告诉我们它是乔治亚州的亚特兰大。
专利说明书告诉我们遵循该专利将获得以下优势:
(1) 在索引页面中使用语义地理标记可以帮助提供更相关的搜索结果。
(2) 相关语义地理令牌的使用减少了搜索引擎返回搜索结果的次数。
(3) 搜索结果的结果分数往往更好和更精确,因为涉及搜索查询中的位置短语所引用的地理位置的结果的可信度增加。
最近授予的这项专利是:
语义地理标记
发明人:Daniel Francis Lieuwen、Andrew William Hogue、Greg Morris 和 Denis M. Lynch
受让人:GOOGLE INC.
美国专利 9,582,548
授予日期:2017 年 2 月 28 日
提交时间:2014 年 12 月 29 日
抽象的
用于提供地理相关搜索结果的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。 在一个方面,一种方法包括接收资源的地理令牌。 地理令牌可以是引用地理位置的资源令牌。 可以使用接收到的地理标记来选择语义地理标记。 语义地理标记是地理位置的标准化表示,包括一个或多个特定于位置的术语。 语义地理标记与资源的引用一起存储。 确定地理位置的相邻位置。 邻近位置在地理位置的预定距离内。 相邻位置的语义地理标记是通过参考资源来选择和存储的。 提供了指定语义地理标记的数据和对资源的引用。
参考地理位置
Web 上的页面可以通过多种方式引用地理位置:
(1) 有关特定活动或业务所在位置的信息,
(2) 用户可以从中选择其特定地理位置的地理位置列表。
(3) 将资源与地理位置相关联的地理令牌。
可以引用位置的方式:
(1) 其所在地的邮政地址列表(即城市中的确切街道地址,例如亚特兰大)。
(2) 一个城市的本地活动列表,仅引用城市名称(例如,亚特兰大)而没有列出活动的确切地址。
(3) 指代地理位置的不同 Geotoken,例如指代城市,或市和州的查询,或邮政编码,例如“家庭活动(30309”或“亚特兰大或亚特兰大,乔治亚州)”。 。” (此类地理标记中的“或”语句越多,搜索所需的时间就越长。
(4) 引用邻近位置的 Geotoken 也可用于搜索,例如搜索亚特兰大,其中还包括(“或”)在乔治亚州迪凯特的搜索。

与我在本文开头链接的“地理位置标识符”专利中描述的方法相比,这似乎是一种搜索涉及位置的查询的更广泛的方法——谷歌可能已经改进了在两者之间的十年中进行地理搜索的方式专利。
生成语义地理标记
搜索引擎可以生成语义地理标记以识别与搜索查询中的位置短语相关的资源。 我们被告知了一些关于地理令牌的事情,例如:
语义地理标记装置是一种数据处理装置,包括一个或多个处理器,这些处理器被配置为基于对与资源相关联的地理位置的一个或多个引用(例如,识别地理位置的文本)来生成资源的语义地理标记。 地理参考通过被包括在资源中和/或被包括在对资源的参考(例如,活动链接)中而与资源相关联。 这些地理参考称为地理标记。
页面上的地理相关性分数
“页面上”地理相关性分数可以基于在页面上使用的地理标记(例如,单词、短语、元信息、图像、音频或其他指定地理位置的信息)的数量和位置以及特异性。 使用文本“Atlanta, Ga”的网页。 作为网页的标题或主要标题,与使用下拉菜单中的文本“亚特兰大”或其他“样板”内容相比,亚特兰大的页面上的地理相关性得分更高。
该专利更详细地定义了这一点:
地理相关性分数是指定资源与地理标记所引用的地理位置相关的可能性的值。 如下文更详细描述的,语义地理令牌设备确定资源的“页面上”地理相关性分数。 “页面上”地理相关性分数是基于资源本身中包含的地理标记指定资源的地理相关性度量的值。
离页地理相关性分数
这些“页外”地理相关性分数来自资源引用中包含的地理标记,例如链接到网页的活动链接,并且可能包含锚文本“亚特兰大”(或其他对亚特兰大的引用,例如邮政编码亚特兰大)来确定资源相对于亚特兰大位置的页外地理相关性分数。 谷歌会同时查看页面内和页面外信号来确定页面是否与特定位置相关,这是有道理的,他们这样做可能不足为奇。
地理相关性的置信度分数
页面与特定位置有关的页面内和页面外信号的组合组合起来满足可指示资源与该位置有关的置信度分数。
在 Google 的搜索索引中存储语义地理标记
该专利告诉我们,这些语义地理标记可能会在搜索索引中进行评分。 当您搜索“Pizza in Carlsbad”时,Google 可以快速识别所有可能位于 Carlsbad 的页面,然后找到与 Pizza 相关的页面。
Geotoken 的地理相关性分数
该专利提供了更多关于某些地理令牌有多强大的提示,例如:
(1) 在页面标题中指示位置的地理标记比在页面脚注中指示位置的地理标记更强大。
(2) 仅引用页面标题中一个位置的地理标记比引用标题中多个位置的标题具有更大的权重。
(3) 在页面上比其他位置更早引用的位置可被视为领先地理标记,并且它可能是哪个位置与页面最相关的强烈指示。
(4) 页面标签中的地理标记可能比该位置仅在页面内容中的排名更高。
(5) Boilerplate 中的 Geotoken 可能会被忽略或分配比其他 geotoken 更低的权重。
(6) 符合条件的地理标记可能会被合并并分配比其他地理标记更高的权重,例如出现在同一页面上的“克利夫兰”和“俄亥俄”的地理标记——它们可以组合为“俄亥俄州克利夫兰”地理标记。
(7) 页外地理标记可以与页内地理标记结合使用,例如使用锚文本“Cleveland”的链接指向标题为“Ohio”的页面。
(8) 更精确的地理标记(例如完整的邮政街道地址)的地理相关性分数高于不太精确的地理标记(例如城市名称)的地理相关性分数。
(9) 诸如街道地址之类的地理标记被认为是“高精度地理标记”。
(10) 邻近位置的置信度分数可能会降低,但会包含在搜索特定位置的过程中,例如搜索“新泽西州萨默维尔的披萨”,这可能会显示 10 公里外的 Raritan NJ 的结果。 较低的置信度分数意味着较低的搜索结果排名。
