ウェブサイトとカテゴリの訪問期間に関するパンダの特許
公開: 2017-07-28
数か月前の6月に、「パンダをクリック:繰り返しクリック数と訪問時間に基づく高品質の検索結果」という投稿を書きました。
その投稿で、GoogleのPandaアップデートにちなんで名付けられたGoogle検索エンジニアのNavneet Pandaが、高品質の検索結果に焦点を当てたいくつかの特許に取り組んだことを指摘しました。 そして、私は自分自身を助けることができませんでしたが、パンダの更新以降にパンダによって書かれた可能性のある新しい特許を確認します。 私が6月に書いた特許は、検索結果の繰り返しクリックとそれらのページへの訪問時間の測定に関する情報を追加した継続特許でした。 繰り返しクリックしたり、サイトへの訪問時間を測定したりすることは、私が同じように調査する価値のあるものを見つけることができるかどうか疑問に思うほど興味深いものでした。
彼は他のウェブサイトで同様の信号を見ていましたか?
ウェブサイトの継続時間のパフォーマンススコア
NavneetPandaとJamesA。Kunzによる2016年12月6日の特許は、カテゴリ期間に基づくWebサイト期間のパフォーマンスというタイトルで、Webサイトの期間とサイトのセクションへのクリックを調べています。 特許の説明は、この特許がどのように機能するかについての要約を示しています。 最初の部分はかなり単純に見えます:
インデックス、クエリログ、およびナビゲーションログは、サイトデータを生成するために処理されます。 サイトデータはWebサイトを記述し、ユーザーによるWebサイトの特定のリソースへの訪問とそれらの各訪問の期間を特徴付けるデータを含みます。 たとえば、訪問データは、検索結果のWebページに含まれる検索結果のユーザーによるクリックまたはURLの直接入力を識別し、選択と入力のそれぞれについて、ユーザーがリソースを要求し、ユーザーデバイスが別のリソースを要求した時刻。
この特許では、「期間」という言葉を使用して、ページにアクセスするのにかかる可能性のある時間を説明しています。
得られたデータは、リソースへのユーザーの訪問とそれらの訪問の期間を特徴づけます。 このデータでは、訪問の期間はさまざまな方法のいずれかで測定できます。 たとえば、訪問の期間は、ユーザーがリソースのリクエストを開始してから、たとえばリソースへのリンクをクリックするか、提供された入力フィールドにリソースのリソースロケーターを入力するまでの時間として測定できます。ユーザーデバイス上で実行されているアプリケーションプログラムまたはアプリケーションプログラムへのアドオン、およびユーザーが別のリソースに対する別の要求を開始する時間。 あるいは、持続時間は、例えば、リソースがアプリケーションプログラムによって完全にレンダリングされる時間と、ユーザが別のリソースに対する別の要求を開始する時間との間の時間として測定され得る。
この特許は、リソースに関連付けられている可能性のあるカテゴリまたはトピックの重みにも注目しています。
検索エンジンの外部のプロセスは、リソースとWebサイトを分類する場合があります。 一部の実装では、リソースは個別に分類され、Webサイトはリソースカテゴリに基づいて分類されます。 各リソースおよびWebサイトは、複数のカテゴリに属する場合もあり、各カテゴリは、リソースおよび/またはWebサイトへのカテゴリの関連付けの強さの尺度であるカテゴリの重みによって反映される場合があります。 たとえば、レストランのチェーンを立ち上げるプロのアスリートに関するニュース記事を含むリソースには、ニュース、スポーツ、および食事のカテゴリに対する中程度の関連性をそれぞれ反映するカテゴリの重みがあります。 逆に、国際紛争に関するニュース記事を含むリソースは、国際ニュースのカテゴリとの関連性が非常に高いことを反映して、カテゴリの重みを持っている場合があります。
この特許は、サイトのさまざまなカテゴリに基づいて、セッションの長さを測定し、期間を測定することについて説明しています。 期間スコアの興味深い使用法は次のとおりです。
期間パフォーマンススコアは、検索操作のリソースとWebサイトのスコアリングに使用できます。 検索操作には、検索結果のリソースのスコアリング、Webサイトのインデックス作成の優先順位付け、リソースまたはWebサイトの提案、特定のリソースまたはWebサイトの降格からの保護、特定のリソースまたはWebサイトのプロモーションからの除外、またはその他の適切な検索操作が含まれる場合があります。
サイトのさまざまな部分への訪問に関して収集された期間情報は、検索エンジンにそのサイトについてより多くを伝えるために使用される場合があります。 カテゴリ期間スコアに基づくWebサイト期間パフォーマンススコアについて通知されます。
プロセスは、ウェブサイトが属する複数のカテゴリーのそれぞれについて、持続時間測定に基づいてカテゴリー持続時間スコアを決定し、各カテゴリー持続時間スコアは、持続時間測定からの持続時間に比例する(206)。 いくつかの実装形態では、カテゴリ期間スコアを決定するために、単一のウェブサイト期間スコアがウェブサイトに対して決定され、次に期間スコアがウェブサイトのカテゴリ期間スコアを生成するために使用される。 これらのカテゴリの継続時間スコアから、Webサイトの継続時間パフォーマンススコアが決定されます。
プロセスは、1つまたは複数のカテゴリ期間スコアから、Webサイトの期間パフォーマンススコアを決定します(208)。 持続時間性能スコアは、いくつかの実装形態では、持続時間性能スコアが決定される1つまたは複数のカテゴリ持続時間スコアに比例する(208)。 たとえば、継続時間パフォーマンススコアは、Webサイトのすべてのカテゴリ継続時間スコアに基づく場合があります。 あるいは、継続時間パフォーマンススコアは、Webサイトのカテゴリ継続時間スコアの適切なサブセットに基づく場合があります。
ノイズの低減
ランキングでのユーザー行動データの使用に関してGoogleの誰かがよく言及する問題の1つは、それがしばしばノイズの多い信号であるということです。 この特許は、そのような信号のノイズを低減するためにどのように機能するかについて説明しています。 そのような議論を見るのは興味深いです。 (ノイズの多い信号を減らすことについてGoogleからこのようなリストを見たことがあるかどうかはわかりません。)ノイズを減らすことができるいくつかの方法を次に示します。
ショートクリックの除外とその他のノイズ要因の削減–一部の実装では、セッションの継続時間を決定するときに、最後にアクセスした継続時間が割引されます。 最後に訪問した継続時間は、ユーザーデバイスがWebサイトからリソースを要求し、別の別のWebサイトからリソースを要求したことに応答して生成された継続時間の測定値に対応します。 割引は、たとえば、「ショートクリック」を除外するために、検索結果が選択されてからユーザーが検索結果ページに戻った場合、またはページの読み込みの遅延のためにWebサイトへの1回のアクセスが長くなった場合に行われます。 最後に訪問した期間を割り引くもう1つの理由は、最後に訪問した期間が2)他のノイズ要因の影響を受けやすいことです。たとえば、ユーザーがリソースを表示した状態でコンピューターを離れ、1時間後に戻って、すぐに別のリソースに移動するなどです。別のウェブサイトの。 たとえば、上記の表1から最後に訪問した継続時間を割り引くと、525秒の継続時間が計算されます。
以前に訪問した継続時間の削除–一部の実装では、セッションの継続時間を決定するときに、以前に訪問した継続時間を追加します。 前回の訪問時間は、2番目のWebサイトで最初のリソースを選択する直前に最初のWebサイトで最後に訪問したリソースで生成された時間測定に対応します。 たとえば、上記の表1では、WebサイトS0でのリソースR0の継続時間の測定値は160秒です。 これは、リソースR1〜R7の期間の前回の訪問期間です。 したがって、上記の表1から最後に訪問した期間を割り引いて、前回の訪問した期間を考慮に入れると、685秒の期間が計算されます。
以前の訪問からのブーストへの対処–一部の実装では、リソースのアドレスの直接ユーザー入力に応答してリソースを要求するユーザーデバイスに応答して生成された各期間測定値がブーストされます。 このような直接入力は、品質に対するユーザーの肯定的な評価を示しているため、そのリソースの継続時間が長くなります。 ブースト値は、固定値にすることも、ユーザーがアドレスを直接入力する頻度または量に比例する場合もあります。 たとえば、ブースト係数が1.5であり、最後に訪問した期間の割引も使用されていると仮定します。 上記の表1から、ユーザーからの直接入力に応答して最初のリソースが要求された場合、585秒のWebサイト継続時間が計算されます。
テイクアウト
誰かがサイトでクリックする可能性のあるものや、そのサイトで費やす可能性のある時間など、ユーザーの行動データを調べるGoogleの特許を見るのは興味深いことです。 また、ユーザーの行動信号からのノイズをどのように減らすことができるかについてのGoogleの議論を見るのも興味深いです。 そのような議論の著者がパンダと名付けられたとき、それはそれを再訪する価値があります。

