在涉及地理位置查詢的 Google 上獲得更好的自然搜索結果

已發表: 2017-03-10

Go Fish 數字定位

谷歌在涉及位置查詢的有機搜索結果方面是否做得更好?

我首先開始尋找專利來幫助我建立一個網站,該網站背後的業務位置對於他們在自然搜索結果中開展的業務非常重要。 我當時撰寫的專利名為為網頁分配地理位置標識符。 谷歌最近獲得了一項專利,該專利使網站頁面顯著位置的位置指示變得非常重要。 我想起了有關地理位置查詢的最新專利。

這項新專利提供了一個潛在問題的示例,這些問題可能發生在針對地理位置的搜索中:

一些提供搜索查詢的用戶對接收引用資源的搜索結果感興趣,這些資源包括與特定位置相關的信息。 例如,提交搜索查詢“亞特蘭大家庭活動”的用戶可能正在搜索提供有關亞特蘭大市信息的網頁。 響應於搜索查詢“亞特蘭大家庭活動”而提供的搜索結果可能包括一個網頁,該網頁不提供關於亞特蘭大甚至亞特蘭大市的家庭活動的信息,而僅包括單詞 Atlanta。

例如,搜索結果引用的一個資源可以是零售商站點,該站點包括允許用戶指定他們當前位置以識別所選位置附近的零售位置的下拉菜單。 另一個資源可以在資源的腳註中包含單詞 Atlanta,該資源指定開發網頁的公司的營業地點。 儘管上述兩種資源都包含文本“亞特蘭大”,但這些資源不太可能滿足提交“亞特蘭大家庭活動”搜索查詢的用戶的信息需求,因為這些資源提供的有關家庭活動的信息很少亞特蘭大市。

這項新專利引入了他們稱之為“語義地理標記”的東西。 語義地理標記是“地理位置的標準化表示,包括該地理位置的一個或多個特定於位置的術語。”

這個地理令牌是否提供了足夠的信心來證明它是關於特定地點的? 該置信度可以部分地基於在頁面上的顯著位置提及某個地點的位置。

我們還被告知,這種方法將涉及確保我們對頁面上的位置具有足夠的特異性,例如指定地理位置的城市和州,因此搜索亞特蘭大發生的事情應該在頁面告訴我們它是喬治亞州的亞特蘭大。

專利說明書告訴我們遵循該專利將獲得以下優勢:

(1) 在索引頁面中使用語義地理標記可以幫助提供更相關的搜索結果。

(2) 相關語義地理令牌的使用減少了搜索引擎返回搜索結果的次數。

(3) 搜索結果的結果分數往往更好和更精確,因為涉及搜索查詢中的位置短語所引用的地理位置的結果的可信度增加。

最近授予的這項專利是:

語義地理標記
發明人:Daniel Francis Lieuwen、Andrew William Hogue、Greg Morris 和 Denis M. Lynch
受讓人:GOOGLE INC.
美國專利 9,582,548
授予日期:2017 年 2 月 28 日
提交時間:2014 年 12 月 29 日

抽象的

用於提供地理相關搜索結果的方法、系統和裝置,包括編碼在計算機存儲介質上的計算機程序。 在一個方面,一種方法包括接收資源的地理令牌。 地理令牌可以是引用地理位置的資源令牌。 可以使用接收到的地理標記來選擇語義地理標記。 語義地理標記是地理位置的標準化表示,包括一個或多個特定於位置的術語。 語義地理標記與資源的引用一起存儲。 確定地理位置的相鄰位置。 鄰近位置在地理位置的預定距離內。 相鄰位置的語義地理標記是通過參考資源來選擇和存儲的。 提供了指定語義地理標記的數據和對資源的引用。

參考地理位置

Web 上的頁面可以通過多種方式引用地理位置:

(1) 有關特定活動或業務所在位置的信息,
(2) 用戶可以從中選擇其特定地理位置的地理位置列表。
(3) 將資源與地理位置相關聯的地理令牌。

可以引用位置的方式:

(1) 其所在地的郵政地址列表(即城市中的確切街道地址,例如亞特蘭大)。
(2) 一個城市的本地活動列表,僅引用城市名稱(例如,亞特蘭大)而沒有列出活動的確切地址。
(3) 指代地理位置的不同 Geotoken,例如指代城市,或市和州的查詢,或郵政編碼,例如“家庭活動(30309”或“亞特蘭大或亞特蘭大,喬治亞州)”。 。” (此類地理標記中的“或”語句越多,搜索所需的時間就越長。
(4) 引用鄰近位置的 Geotoken 也可用於搜索,例如搜索亞特蘭大,其中還包括(“或”)在喬治亞州迪凱特的搜索。

與我在本文開頭鏈接的“地理位置標識符”專利中描述的方法相比,這似乎是一種搜索涉及位置的查詢的更廣泛的方法——谷歌可能已經改進了在兩者之間的十年中進行地理搜索的方式專利。

生成語義地理標記

搜索引擎可以生成語義地理標記以識別與搜索查詢中的位置短語相關的資源。 我們被告知了一些關於地理令牌的事情,例如:

語義地理標記裝置是一種數據處理裝置,包括一個或多個處理器,這些處理器被配置為基於對與資源相關聯的地理位置的一個或多個引用(例如,識別地理位置的文本)來生成資源的語義地理標記。 地理參考通過被包括在資源中和/或被包括在對資源的參考(例如,活動鏈接)中而與資源相關聯。 這些地理參考稱為地理標記。

頁面上的地理相關性分數

“頁面上”地理相關性分數可以基於在頁面上使用的地理標記(例如,單詞、短語、元信息、圖像、音頻或其他指定地理位置的信息)的數量和位置以及特異性。 使用文本“Atlanta, Ga”的網頁。 作為網頁的標題或主要標題,與使用下拉菜單中的文本“亞特蘭大”或其他“樣板”內容相比,亞特蘭大的頁面上的地理相關性得分更高。

該專利更詳細地定義了這一點:

地理相關性分數是指定資源與地理標記所引用的地理位置相關的可能性的值。 如下文更詳細描述的,語義地理令牌設備確定資源的“頁面上”地理相關性分數。 “頁面上”地理相關性分數是基於資源本身中包含的地理標記指定資源的地理相關性度量的值。

離頁地理相關性分數

這些“頁外”地理相關性分數來自資源引用中包含的地理標記,例如鍊接到網頁的活動鏈接,並且可能包含錨文本“亞特蘭大”(或其他對亞特蘭大的引用,例如郵政編碼亞特蘭大)來確定資源相對於亞特蘭大位置的頁外地理相關性分數。 谷歌會同時查看頁面內和頁面外信號來確定頁面是否與特定位置相關,這是有道理的,他們這樣做可能不足為奇。

地理相關性的置信度分數

頁面與特定位置有關的頁面內和頁面外信號的組合組合起來滿足可指示資源與該位置有關的置信度分數。

在 Google 的搜索索引中存儲語義地理標記

該專利告訴我們,這些語義地理標記可能會在搜索索引中進行評分。 當您搜索“Pizza in Carlsbad”時,Google 可以快速識別所有可能位於 Carlsbad 的頁面,然後找到與 Pizza 相關的頁面。

Geotoken 的地理相關性分數

該專利提供了更多關於某些地理令牌有多強大的提示,例如:

(1) 在頁面標題中指示位置的地理標記比在頁面腳註中指示位置的地理標記更強大。

(2) 僅引用頁面標題中一個位置的地理標記比引用標題中多個位置的標題具有更大的權重。

(3) 在頁面上比其他位置更早引用的位置可被視為領先地理標記,並且它可能是哪個位置與頁面最相關的強烈指示。

(4) 頁面標籤中的地理標記可能比該位置僅在頁面內容中的排名更高。

(5) Boilerplate 中的 Geotoken 可能會被忽略或分配比其他 geotoken 更低的權重。

(6) 符合條件的地理標記可能會被合併並分配比其他地理標記更高的權重,例如出現在同一頁面上的“克利夫蘭”和“俄亥俄”的地理標記——它們可以組合為“俄亥俄州克利夫蘭”地理標記。

(7) 頁外地理標記可以與頁內地理標記結合使用,例如使用錨文本“Cleveland”的鏈接指向標題為“Ohio”的頁面。

(8) 更精確的地理標記(例如完整的郵政街道地址)的地理相關性分數高於不太精確的地理標記(例如城市名稱)的地理相關性分數。

(9) 諸如街道地址之類的地理標記被認為是“高精度地理標記”。

(10) 鄰近位置的置信度分數可能會降低,但會包含在搜索特定位置的過程中,例如搜索“新澤西州薩默維爾的披薩”,這可能會顯示 10 公里外的 Raritan NJ 的結果。 較低的置信度分數意味著較低的搜索結果排名。