Googleセーフサーチ結果の特許および結果の再ランク付けまたは削除

公開: 2018-10-11

Googleはセーフサーチ結果フィルターをどのように使用して、不適切、機密、または不快な検索結果を処理しますか?

検索者がインターネットで抱えている可能性のある問題の1つは、他の人にも表示されることを期待していない、または公開する意思のないコンテンツに驚かされることです。 Googleで最近付与された特許は、検索エンジンがそのようなコンテンツから検索者を保護するための取り組みについて説明しています。 彼らがその特許の中でそれを表現するとき:

インターネットユーザーは、検索エンジンを使用してさまざまな種類のコンテンツを検索できます。 インターネットコンテンツには、ポルノ、残酷な画像、暴力的なコンテンツなど、デリケートなコンテンツや不快なコンテンツが含まれる場合があります。 場合によっては、ユーザーが不適切な機密性の高いコンテンツや不快なコンテンツに不本意にさらされる可能性があります。 したがって、インターネット上で利用可能な不適切な機密または不快なコンテンツへの露出を制限することが望ましい場合があります。

この特許はセーフサーチ結果に何度か言及しており、グーグルのスパム責任者になる前に、グーグルのマットカッツがセーフサーチ結果を表示する責任があると聞いたのを覚えています。 セーフサーチ結果に特許があるのか​​、それとも彼がそれと関係があるのだろうかと思ったのですが、見たことがありませんでした。 これはセーフサーチ結果について何度も言及しているので、私はそれをグーグルのセーフサーチ結果特許と考えるでしょう。

Googleセーフサーチ結果特許の背後にある目的は、Google検索エンジンを使用している検索者が見たくないコンテンツにさらされるのを防ぐことです。

この開示は、一般に、分類器を検索クエリおよび検索結果に適用して、ユーザーが不適切な不快または機密コンテンツへの露出から保護される検索体験を提供するための方法およびシステムを説明する。

そのような安全な検索結果分類子は正確にどのように機能しますか?

1)クエリに応答して、検索エンジンはSERPの予備セットを返します。
2)クエリは分類子によって分類され、保護されたクラスの人々に関連付けられた1つ以上の用語、またはポルノや暴力的なコンテンツなどの機密または不快なコンテンツに関連付けられた用語が含まれるかどうかが判断されます。
3)予備的な結果も分類され、機密コンテンツまたは不快なコンテンツが含まれているかどうかが判断されます
4)検索結果は検索者に返されるため、不適切な機密コンテンツや不快なコンテンツが検索者に表示されることはありません。

検索者は、検索クエリが次のようなクエリ用語を含むように分類されていることを示します。

(i)特定のクラスの人々とは関係がない可能性が高い。
(ii)特定のクラスの人々に関連している可能性が高い、または
(iii)特定のクラスの人々に関連している可能性が高く、デリケートな用語や不快な用語が含まれている可能性があります。

また、検索結果は次のように分類される可能性が高いと通知されます

(i)機密性が低く、不快感を与えないコンテンツ、または
(ii)機密または不快なコンテンツ。

検索結果の候補セットから、安全な検索結果のプレゼンテーションセットが選択されます。
(I)検索クエリが次のようなクエリ用語を含むものとして分類されていることの表示

(i)特定のクラスの人々とは関係がない可能性があります。
(ii)特定のクラスの人々に関連している可能性が高い、または
(iii)特定のクラスの人々に関連している可能性が高く、デリケートな用語や不快な用語が含まれている。

(II)検索結果が以下を含む可能性が高いと分類されていることの表示:

(i)機密性が低く、不快感を与えないコンテンツ、または
(ii)機密または不快なコンテンツ。 検索結果のプレゼンテーションセットの1つまたは複数の検索結果が、検索クエリへの応答として出力用に提供されます。

これらの結果の一部には、影響を受ける特定のクラスの人々が含まれます。これには、少なくとも1つの共通の人口統計学的特性を持つ人々のグループが含まれます。

また、結果によっては、デリケートな用語や不快な用語に、ポルノ、暴力、流血、なりすましの1つ以上に関連する用語が含まれる場合があります。 デリケートなコンテンツや不快なコンテンツには、ポルノ、暴力、流血、なりすましの1つ以上に関連する画像、動画、データが含まれます。

場合によっては、検索結果の候補セットの中からセーフ検索結果のプレゼンテーションセットを選択することには、以下のアクションの1つ以上が含まれます。

場合によっては、検索結果の候補セット内の検索結果のランキングは、

(i)検索結果を取得するために使用された検索クエリが、特定のクラスの人々に関連している可能性が高いと分類されていることの表示。
(ii)検索結果が機密または不快なコンテンツを含む可能性が高いと分類されていることの表示。

場合によっては、検索結果の候補セット内の検索結果をフィルタリングして、に基づいて検索結果のプレゼンテーションセットから検索結果を削除することができます。

(i)検索結果を取得するために使用された検索クエリが、特定のクラスの人々に関連している可能性が高く、機密または不快な用語を含むものとして分類されていることの表示、および
(ii)検索結果が機密または不快なコンテンツを含む可能性が高いと分類されていることの表示。

場合によっては、安全な検索結果の候補セット内の検索結果を選択して、検索結果のランキングを変更したり、検索クエリが使用したという指示に基づいて検索結果をフィルタリングたりせずに、検索結果のプレゼンテーションセットに含めることができます。検索結果を取得することは、特定のクラスの人々に関連している可能性が低く、機密性の低い用語や不快感のない用語を含む可能性が高いと分類されます。

場合によっては、検索結果の候補セットの中から検索結果のプレゼンテーションセットを選択することには、以下のアクションの1つ以上が含まれます。

(1)場合によっては、検索結果のランキングを変更したり、検索結果の表示に基づいて検索結果をフィルタリングしたりせずに、検索結果の候補セット内の検索結果を選択して、検索結果のプレゼンテーションセットに含めることができます。検索結果を取得するために使用されるクエリは、特定のクラスの人々に関連していない可能性が高く、機密性の高い用語や不快な用語が含まれている可能性が高いと分類されます。

(2)場合によっては、検索結果の候補セット内の検索結果をフィルタリングして、検索結果の取得に使用された検索クエリが可能性が高いと分類されたという指示に基づいて、検索結果のプレゼンテーションセットから検索結果を削除することがあります。特定のクラスの人々に関連し、デリケートな用語や不快な用語を含む可能性があります。

(3)場合によっては、コンピュータで実施される方法のアクションは、検索結果の候補セット内の各検索結果に対応するドキュメントの関連性スコアを生成し、候補セット内の各検索結果のランキングを決定することを含み得る。検索結果、およびユーザーデバイスの1つ以上の属性を含むユーザーセッションデータの受信。

関連性スコアは、検索クエリに対するドキュメントの関連性を示します。 検索結果の候補セットの中から検索結果のプレゼンテーションセットを選択することは、ユーザデバイスの1つまたは複数の属性を含むユーザセッションデータに基づいて、検索結果の候補セットにおける1つまたは複数の検索結果のランキングを変更することをさらに含む。 。

場合によっては、検索結果の候補セットの中から検索結果のプレゼンテーションセットを選択することは、検索結果に対応するドキュメントごとに、少なくとも検索結果の表示に基づいて、ドキュメントにラベルを割り当てることを含み得る。機密性の高いコンテンツや不快なコンテンツを含むものとして分類され、割り当てられたラベルに基づいて検索結果をフィルタリングするか、検索結果のランキングを変更するかを決定します。 ラベルは、ドキュメントに含まれる主題を示しています。

これらのフィルタリングまたは包含のすべてが行われる可能性のある特許は、以下に記載されています。

不適切な機密または不快な検索結果からユーザーを保護する
発明者:マティアス・ハイラー、マイケル・シェアー、ニコラ・トドロビッチ、ロビン・ニットカ、トーマス・フィッシュバッハー、ローラ・ドラゴイ。
譲受人:Google LLC
米国特許:10,083,237
付与:2018年9月25日
提出日:2015年8月31日

概要

不適切な攻撃的または機密性の高いコンテンツへの露出からユーザーを保護する検索エクスペリエンスを提供するためのシステムおよび方法について説明します。 検索システムは、検索クエリと、検索クエリに応答して得られた候補検索結果とを分類することができる。 検索クエリおよび検索結果の分類に基づいて、候補検索結果を変更して、提示された検索結果に不適切な機密または不快なコンテンツが含まれないように、ユーザーに提示される一連の検索結果を生成することができる。

セーフサーチ結果特許に基づくいくつかの定義

この特許は、ポルノ、残酷な画像、暴力的なコンテンツを指すものとして、私たちにとって「デリケートなコンテンツまたは不快なコンテンツ」を定義しています。

また、「不適切な機密または不快なコンテンツ」を機密または不快なコンテンツのサブカテゴリとして定義し、次のようなコンテンツを含めることができます。

  • ギャング募集内容
  • 暴力を扇動するコンテンツ
  • 特定の人口統計グループをあざける、または特定の人口統計グループに対する憎悪を煽るコンテンツ
  • なりすましコンテンツ

「一般的に、保護されたクラスのインターネットユーザーにとって違法、虐待的、または非常に不快なコンテンツを指す場合もあります。」

この特許はまた、一部の検索結果に敏感である可能性のある検索者を保護することを目的としていることも示しています。

その保護されたクラスのユーザーには、少なくとも1つの人口統計学的特性が共通しており、不適切な機密または不快なインターネットコンテンツからの保護が望まれる可能性のある人々のグループが含まれる場合があります。

10代の若者が保護されたクラスとしてコンテンツをどのように扱うか

セーフサーチ結果特許の説明は、「ティーンエイジャーがグループに参加する理由」などのクエリに応答してティーンエイジャーを対象とする検索結果の例から始まります。 検索エンジンはそのクエリを受信し、一連の検索結果を取得して、そのクエリに応答して表示します。

検索エンジンはまた、いくつかの分類信号を受信し、分類信号に基づいて、候補検索結果のセットから検索結果のセットを選択して、子検索者に提示する。

「TeenRecruitment」というタイトルの検索結果の1つに、関連性スコア96が与えられ、「Teen Recruitment」に対応する検索結果ドキュメントに、子供ユーザーを含むすべてのユーザーに表示できるコンテンツが含まれていることを示すラベルが割り当てられます。デリケートなコンテンツや不快なコンテンツは含めないでください。

別の結果は、関連性スコアが87の「ティーンギャングリクルーター」というタイトルで、「ティーンギャングリクルーター」に対応する検索結果ドキュメントに暴力的なコンテンツや不快な画像が含まれている可能性があることを示すラベル「v」が割り当てられています。

その他の検索結果には、「ニュース:ティーングループ」と「子供たちのグループ」というタイトルが付けられており、関連性スコアはそれぞれ79と34で、検索結果が「ニュース:ティーングループ」と「グループ」に対応することを示すラベルが割り当てられています。 「子供向け」であり、子供ユーザーを含むすべてのユーザーに表示できるコンテンツが含まれている可能性があり、機密性の高いコンテンツや不快なコンテンツは含まれていません。

使用された分類信号に基づいて、一部の結果は承認され、一部は削除され、その他は子検索者に提示される前に再ランク付けされる場合があります。

「ニュース:10代のグループ」など、一部の結果は再ランク付けされて検索結果の上位に表示される場合があります。

10代に関連する暴力的なコンテンツが含まれている可能性が高い「ティーンギャングのリクルーター」に関する結果など、一部の結果は下位に再ランク付けされる場合があります。

セーフサーチ結果の特許によると、このアプローチの焦点は次のとおりです。

選択された検索結果のセットは、ユーザーデバイスに検索結果のプレゼンテーションセットとして出力され、子供ユーザーは不適切な機密コンテンツや不快なコンテンツにさらされることなく安全な検索エクスペリエンスを楽しむことができます。

その他の保護されたグループおよびその他のフィルター

セーフサーチ結果の特許は、他のグループの結果など、他の例を提供します。

(i)関連性スコアが96の「弁理士のなりすまし」と、「弁理士のなりすまし」というタイトルの検索結果に関連付けられたドキュメントに、保護されたクラスの人々に関連付けられたなりすましコンテンツなど、不適切な機密または不快なコンテンツが含まれている可能性があることを示すラベル(例えば、弁理士)。

(ii)関連性スコアが92の「悪ふざけ」と、「IP悪ふざけ」というタイトルの検索結果に関連付けられたドキュメントに、保護されたクラスに向けられた侮辱的なジョークなど、不適切な機密または不快なコンテンツが含まれている可能性があることを示すラベル人の;

(iii)関連性スコアが89の「Funnypatent attorney moments」と、「Funnypatent attorneymoments」というタイトルの検索結果に関連付けられたドキュメントに機密または不快なコンテンツが含まれていない可能性が高いことを示すラベル。 と

(iv)関連性スコアが74の「ユーモア弁護士」と、検索結果に関連付けられた「ユーモア弁護士」というタイトルのドキュメントに機密性の高いコンテンツや不快なコンテンツが含まれていない可能性が高いことを示すラベル。

この特許は、これらのクエリのどのコンテンツが削除または再ランク付けされた可能性があるかを示しています。

この特許には、政治的なジョーク、政治的なミーム、政治的なスキャンダルなどをカバーする他の例も含まれています。

また、検索エンジンがフィルタリングするコンテンツを識別する方法についての詳細も提供します。

セーフサーチ結果特許からの最大のポイント

これまで、保護されたグループが関与するセーフサーチ結果の提供に基づいて検索結果を削除または再ランク付けすることについてGoogleが何も言っているのを見たことがありませんでした。 私は、2003年に連邦裁判所がPageRankが憲法修正第1条の下で言論保護されていると決定したGoogleに対する訴訟を覚えています。