Googleがハウツークエリへの回答を選択する方法

公開: 2020-03-12

Googleがハウツークエリにどのように対応するか

https://gofishdigital.com/google-how-to-queries/

Googleは、ハウツークエリの処理方法に関する特許を公開しています

開発者がHow-toStructured Markupを実装することをGoogleが推奨する方法について具体的には、HowTo構造化データの使用方法に関するGoogle開発者のページも必ずお読みください。 このページでは、ハウツーマークアップの目的を定義しています。

ハウツーでは、タスクを完了するための一連の手順をユーザーに説明し、ビデオ、画像、およびテキストを取り上げることができます。 たとえば、「ネクタイの結び方」や「キッチンのバックスプラッシュのタイル張りの方法」などです。 ハウツーの各ステップを順番に読む必要がある場合は、HowTo構造化データがコンテンツに役立つ可能性があることを示す良い兆候です。 HowTo構造化データは、ハウツーがページの主な焦点である場合に適しています。

Googleは、「ハウツー」クエリに関する特許を取得しました。これは、ハウツークエリへの回答を披露することについて彼らが考えていることを示すために共有する価値があるように見えました。

特許の説明がすぐに私たちに伝えるように:

この仕様は、一般に、多くのソースの分析に基づいてタスクを完了するためのステップバイステップの手順を提供することを目的としています。

開発者のページには、Googleが多くの情報源を分析して、「それらの情報源の分析に基づいてタスクを完了するためのステップバイステップの手順」を提供する方法について説明しているため、特許の情報は含まれていません。

これは、Googleによるハウツークエリに応答するプロセスの背後にあるハウツーです。

  • タスクの実行に関連するハウツークエリおよびハウツークエリに関連するソースを特定することができる
  • ユーザーがタスクを実行できるようにするステップが決定される場合があります
  • ステップの決定は、ハウツークエリに関連するソースの分析に基づく場合があります
  • ソースの信頼性測定値が決定される場合があります
  • 手順は、データベース内のハウツークエリに関連付けられている場合があります
  • これらのステップは、検索者によって送信されたハウツークエリ(または同様のクエリ)に応じて検索者に提供される場合があります。
  • ハウツークエリに関連するソースの分析には、さまざまなステップセットのコンポーネントの比較、および一連のステップを決定するための共通要素の特定が含まれる場合があります。

より詳細には、ハウツークエリプロセスのステップは次のとおりです。

  • タスクの実行に関連するハウツークエリの特定
  • ハウツークエリに対応するソースの特定
  • 識別された複数のソースの1つまたは複数の信頼度を決定し、ハウツークエリのタスクのステップを提供する際の特定のソースの有効性を示す特定のソースの信頼度
  • 識別されたソースの信頼度に基づいてタスクを実行するための手順を決定する
  • ステップをハウツークエリに関連付け、ハウツークエリに応答して提供されるステップを保存する

このプロセスの背後にあるいくつかの追加機能には、次のものが含まれます。

ソースを見つけるとき、1つはユーザーマニュアルであり、そのユーザーマニュアルはソースの1つと見なされる場合があります。 タスクを実行するための一連の手順は、ユーザーマニュアルに基づいている場合があります。

ハウツークエリでの応答の背後にある手順

ハウツークエリに応答する方法には、さらに次のものが含まれる場合があります。

  • 多くの情報源からのステップの特定
  • ステップの各グループからステップを特定する
  • それらのステップに基づいてタスクを実行するためのステップを決定する
  • ソースからのステップ間の類似性測度の決定
  • 類似度に基づいて表示するステップを決定する

Smilarityの測定値は、以下に基づくことができます。

  • キーワードマッチング
  • フレーズマッチング
  • 解析ツリーマッチング
  • 分布類似度スコア
  • 距離スコアを編集する

いくつかの実装形態では、この方法はさらに以下を含み得る。

  • ステップの各グループの各ステップについて、ステップの信頼水準を示す関連性スコアを決定する
  • 関連性スコアに基づいて、ステップのグループから1つ以上のステップを識別します

ハウツークエリ応答でステップがどのように選択されるか

タスクを実行するために示されているステップは、ソースの信頼度に基づいてソースから選択できます。

ソースの信頼性の尺度は、以下に基づく場合があります。

  • 与えられた情報源のランキング
  • 特定のソースへの訪問の頻度
  • 指定されたソースへのリンクの数
  • 与えられたソースの凝集性
  • 特定のソースに関連するユーザーフィードバック

送信されたクエリに応答して提供される可能性のある一連のステップについて、品質基準が決定される場合があります。

検索者のクエリが、クエリによって示されたタスクを完了するためのステップを受け取りたいという願望を示しているという確信に基づいて、送信されたクエリのクエリスコアを決定することもできます。 そして、クエリに応答してステップを表示するという決定は、検索者のニーズを満たします。

この方法はさらに以下を含み得る:

  • タスクを実行するために必要な1つ以上のスキルレベルを決定する
  • タスクを実行するための期間
  • タスクを実行するために必要なツールのリスト
  • タスクを実行するために必要な資料のリスト。

ハウツークエリへの応答に関するこの特許は、次の場所にあります。

ハウツークエリに対応する一連のステップの決定
発明者:Kerwell Liao、Nikhil Sharma、LaDawn Risenmay Jentzsch、およびJennifer Ellen Fernquist
譲受人:GOOGLE LLC
米国特許:10,585,927
付与:2020年3月10日
提出日:2017年3月2日

概要

複数のソースの分析に基づいてタスクを完了するためのステップを提供することに関連する方法および装置。 タスクの実行に関連するハウツークエリおよびハウツークエリに関連する複数のソースを識別し得る。 タスクの実行に関連する一連のステップは、ハウツークエリに関連する複数のソースの分析に基づいて決定することができ、任意選択で、複数のソースの信頼度を決定することを含む。 一連の手順は、データベース内のハウツークエリに関連付けることができます。 一連のステップは、ユーザーによって提出されたハウツークエリに応答してユーザーに提供され得る。 いくつかの実装形態では、ハウツークエリに関連する複数のソースの分析は、異なるステップのセットのコンポーネントを比較し、ステップのセットを決定するための共通の要素を識別することを含み得る。

ハウツークエリのタスク条件と問い合わせ条件

この特許は、彼らがタスク用語および照会用語と呼んでいるもののいくつかの例を指摘しています。

  • 「衣類からタールを取り除く方法」は、衣類からタールを取り除く作業を特定する作業用語(「衣類からタールを取り除く」)を含み、衣類からタールを取り除く際に使用される可能性のある情報。
  • 「車のタイヤを交換するにはどうすればよいですか」は、車のタイヤを交換するタスクを識別するタスク用語(「車のタイヤを交換する」)と、車のタイヤの交換に使用できる情報への要望。

Googleがハウツークエリを特定する方法

1.キー用語またはキーフレーズの使用–これらはクエリに含まれる場合があります。 たとえば、クエリのプレフィックスは、次のような1つ以上のクエリ用語と一致する場合があります。

  • "方法"
  • 「どうすればいいですか」
  • 「どうやって」
  • "誰か知っていますか"
  • 「どこへの指示がありますか」
  • 「どこに指示を出すことができますか」
  • 「誰か教えてもらえますか」
  • 「教えて」
  • "どうやってか教えて"
  • "どうやって"
  • "どこ"
  • "手順"
  • 「?」

2.照会用語と接頭辞続く追加の用語を含む接頭辞の使用。これには、クエリの用語を照会用語に一致させること、およびクエリの用語をタスク用語に一致させることが含まれる場合があります。 例えば:

  • 「パンクしたタイヤを交換しますか?」というクエリ「パンクしたタイヤを交換する」という用語を「パンクしたタイヤを交換する」というタスクフレーズに一致させ、「?」という用語を一致させることに基づいて、ハウツークエリとして識別される場合があります。 照会用語「?」に
  • クエリ「タールの指示を削除する」は、「タールを削除する」という用語をタスクフレーズ「タールを削除する」に一致させ、「指示」という用語を照会用語「指示」に一致させることに基づくハウツークエリとして識別できます。

プレフィックスを照会する方法

3.クエリの用語とクエリの用語および/またはタスクの用語の間の完全一致および/またはソフト一致を使用することができます。

ハウツークエリに頻繁に含まれる可能性のあるキー用語およびキーフレーズ(タスク用語および/または問い合わせ用語を含む)は、コンテンツデータベースに格納される場合があります。

タスク用語は、以下に基づいて識別できます。

  • 品詞のタグ付け
  • セマンティック分析
  • 構文解析
  • その他のテクニック

4.クエリ含まれる照会用語とタスク用語の頻度を使用して、クエリがハウツークエリであるかどうかを判断できます。

クエリ内の重要な用語の頻度および/またはドキュメントの別のコーパス全体の頻度に関連するデータは、オプションでコンテンツデータベースに保存され、faクエリがハウツークエリであるかどうかを判断するために使用されます。

  • 「最初からケーキを作る方法」は、タスク用語「最初からケーキを作る」が過去のクエリで少なくともしきい値レベルの頻度で発生した場合にのみ、ハウツークエリとして識別される可能性があります。

5.クエリの送信頻度は、クエリがハウツークエリであるかどうかを判断するために使用できます。

この頻度は、コンテンツデータベースに保存される場合があります。 クエリが少なくともしきい値レベルの頻度で送信されている場合、クエリはハウツークエリとして識別できます。

  • 「ケーキを最初から作成するにはどうすればよいですか」は、それとそのバリエーションが過去のいくつかのクエリでクエリのしきい値レベルを満たしている場合、ハウツークエリと見なされる場合があります。

6.同様のハウツークエリを相互に関連付けることができます

I同様のハウツークエリ間の関連付けは、コンテンツデータベースに保存される場合があります。 同様のハウツークエリは、次のような同様のタスクを実行するための情報に対する要望を示すクエリです。

  • 「衣類からタールを取り除く方法」
  • 「どうすれば衣類からタールを取り除くことができますか?」
  • 「布からタールを取り除く方法」
  • 「タールの汚れを落とす」
  • 「ステインバスタータール」

同様のハウツークエリは、それぞれの問い合わせ用語および/またはそれらからのタスク用語を比較することによって識別できます。

7.ハウツークエリに関連する検索結果および/または検索結果ドキュメントの分析

クエリに応答するSERPを分析して、クエリによって識別されたタスクの実行に関連するステップを提供するドキュメントが検索結果に含まれているかどうかを判断できます。

したがって、最初にランク付けされたN個の検索結果を分析して、それらのしきい値数に、クエリによって識別されたタスクの実行に関する手順が含まれているかどうかを確認できます。

これらの検索結果のページは、クエリの選択率が最も高いと判断される場合があります。このページは、クエリによって識別されたタスクの実行に関する手順を提供するかどうかを確認するためにも分析できます。

8.同様のクエリは、いくつかの追加のメソッドを使用する場合があります

これらには以下が含まれます。

  • キーワードマッチング
  • フレーズマッチング
  • フレーズのコンテキスト類似性マッチング

9.用語間の類似性は、他の方法で判断できます

これらには次のものが含まれます。

意味的距離、または字句データベースなどの外部リソース内の用語間のエッジに沿ったパスの長さ。 語彙データベースには、単語、名詞、形容詞、動詞、副詞などを含む重要な用語や句、およびそれらの概念的および/または意味的な相互関係が含まれる場合があります。 いくつかの実装形態では、キータームおよび/またはフレーズは、キータームおよび/またはフレーズの意味、および/または他のキータームおよび/またはフレーズとのそれらの構文上の関係に基づいてグループ化され得る。 いくつかの実装形態では、コンテンツデータベースなどのデータベースは、分布的に類似した照会用語および/またはタスク用語、ならびにそれらの対応する分布の類似性スコアを含み得る。 通常、同様の文脈で発生するフレーズは、たとえば、同様の意味を持つと見なされる場合があります。 たとえば、HTML Webページなどのドキュメントのコレクション上で2番目のフレーズと同じ単語と同時発生する最初のフレーズは、2番目のフレーズと分布的に類似していると見なすことができます。 2つ以上のクエリを類似のものとして識別することは、本明細書で説明される方法の1つまたは複数のステップで利用され得る。 たとえば、クエリは、クエリの集合的な頻度がハウツークエリなどのクエリの識別を構成するのに十分であるかどうかを判断し、そのようなクエリによって識別されたタスクを実行するための一連のステップを決定する際にグループ化できます。 また、例えば、ステップのセットおよび/またはそのようなソースに関連する任意のランク付けを決定するためのソースの識別は、複数の同様のクエリのそれぞれのソースのランク付けに基づくことができる。 また、例えば、一連のステップをハウツークエリに関連付けることは、一連のステップを同様のハウツークエリに関連付けることを含み得る。

他の種類のハウツークエリ

この特許は、ハウツークエリが検索者によって検索される可能性のある他のいくつかの事例を説明しています。 これらには次のものが含まれます。

  • 車両への交換部品の取り付け
  • 複雑なソフトウェアのインストール
  • 検索に関連するタスクを実行する(「市内で新しい家を見つけるにはどうすればよいですか?)
  • 地図に関連する場所のクエリ

ソースに関連付けられた信頼性の測定

ソースの信頼度は、特定のハウツークエリを完了するための正しい手順を提供する上でのそのソースの有効性を示している場合があります。

ソースの信頼性の尺度は、以下に基づく場合があります。

  • 指定されたソースの適時性(ソースが最後に更新された時刻を示すタイムスタンプ)。
  • 特定のソースにリンクしているドキュメントの数(ソースの人気または信頼できる価値を示す)
  • 指定されたソースからの発信リンクの数(ソースの包括性を示します)。
  • 発信リンクに基づく場合は、発信リンクの選択率に基づく場合もあります。
  • 与えられた情報源の凝集性の分析
  • 指定されたソースが、ハウツークエリによって識別されたタスクにどの程度密接に関連しているか
  • アンカーテキストの証拠(ページに、ページでカバーされているタスクに関する情報に類似したアンカーテキストのリンクが含まれている場合)。
  • 特定のソースへの訪問の頻度
  • 与えられた情報源の情報対雑音比の分析。 このノイズには、HTMLタグ、空白、無関係なリンク、スポンサー広告、または無関係なコンテンツをカバーするコンテンツなどが含まれる可能性があります
  • ハウツークエリのタスクを完了するために提供されるステップの数(ステップの数が多いほど、包括性を示している可能性があります)。
  • 特定のソースに関連付けられた作成者および/または発行者に基づく(たとえば、ハウツークエリが技術的タスクに関連する場合、作成者および/または発行者はそのような技術的タスクの承認された権限ですか?)
  • ソースの作成者および作成者の属性(適切な技術的資格および/またはハウツークエリに関連する信頼できる情報を提供するための経験など)に基づく)
  • ここで説明する手法は、オプションで組み合わせることができます

その他のアプローチ

  • ハウツークエリは、タスクを実行する方法を説明する取扱説明書にある回答を使用する場合があり、そのマニュアルは、タスクを実行するための手順のソースとして最高の信頼度を持っている場合があります
  • 1つ以上のソース(上位のソース)を使用して、あるソースからのステップと別のソースからのステップを含むタスクを実行するためのステップを含めることができます。
  • オプションとして、いくつかの追加手順が含まれる場合があります
  • 一部のステップは、理想的とは言えないものとして表示およびラベル付けされる場合があります
  • 情報は、一連の手順ではなく、段落で表示できます
  • 自然言語処理技術を使用して、段落または他のテキストセグメントを、タスクの少なくとも一部を実行するステップにセグメント化することができます。

クエリの方法は複数のステップをソースします

この特許は、ハウツークエリに応じてタスクの完了に含まれる可能性のあるステップの類似性の検討、およびステップの関連性スコアに関する情報も提供します。 ステップの関連性スコアは、そのステップが識別されたソースの信頼度に部分的に基づいている場合があります。 したがって、高く評価されている技術マニュアルからのステップは、より高い関連性スコアを持つ可能性があります。

ステップのグループの関連性スコアは、タスクを実行するために必要なステップのグループに対応するステップを識別するソースの数に基づくことができます。
タスクを実行するために達成する個々のステップは、「高信頼度」、「中信頼度」などの信頼度に基づく場合があります。 そして「自信がない」。 (これらのステップがソースに表示される頻度に基づいており、ステップが必須のステップであることを示しています。

したがって、ステップの関連性は、ソースからの信頼度と、それらのステップを含むソースの数の両方に基づいている可能性があります。

ステップは、ハウツークエリに答えるコンテンツデータベースのステップとして含まれるしきい値関連性スコアを満たしている必要があります。

回答を照会する方法の属性

一連のステップに関連付けられた属性は、ハウツークエリに応じてそれらのステップで識別および表示される場合があります。 例としては、次のものがあります。

  • 一連の手順のタイトル(例:「車のタイヤの交換方法」)
  • スキルレベル(例:運転年齢の人)
  • 必要な推定時間(例:25分)
  • 必要な工具(例:ジャックとレンチ)
  • タスクを実行するために必要な資料
  • 決定された一連のステップに関連する1つ以上のソース(ユーザーマニュアルなど)
  • 1つまたは複数の注意事項(たとえば、車を水平面に駐車する、転がりを防ぐためにタイヤの後ろにストッパーを配置する、ハンドブレーキをかける)。

ソースには、一連のステップの基礎となるソース、および/または1つ以上のステップに準拠していると識別されるソースが含まれる場合があります。

この特許には、ステップに関連付けられる可能性のある属性に関する詳細と、各ステップおよび一連のステップに関連付けられる可能性のある各属性の品質基準が含まれています。

また、「最良の推測」や「最高の信頼度」、「最低の信頼度」など、ステップに関連付けられている可能性のあるラベルについても説明します。

ハウツークエリの要点

私はこの特許のさまざまな側面をたくさん含めましたが、詳細がたくさんあり、すべてを網羅しているわけではありません。

特許を読んで、どれが推奨されているかを理解してください。うまくいけば、この投稿によって特許を簡単に確認できるようになります。

特許の背後にあるプロセスで私が非常に興味深いと感じたものの1つは、タスクに関するさまざまな情報源を比較するのにどれだけの努力が払われているか、そしてそれらのタスクを実行するためのステップでした。

ハウツークエリについて、一部の回答が他の回答よりも優れている理由を理解するのに役立つと思います。