Googleの仕組み:Googleランキングエンジニアのストーリー– SMX West2016のカバレッジと分析

公開: 2021-10-08

皆さん、こんにちは。 Linkaratiでは、共有および拡大する価値があると思われるニュース、トレンド、またはプレゼンテーションを随時取り上げています。

今日、私はRaeHoffmanからの説得力のあるツイートに出くわしました。

このリンクは、GoogleのソフトウェアエンジニアであるPaul Haahrの14年間のSMXのビデオにつながります。彼は、SMX West 2016で、Googleランキングエンジニアとしての彼の観点から、Googleの仕組みについてプレゼンテーションを行っています。

Paulを紹介するDannySullivanが言うように、Paulの肩書きは、彼がGoogleのランキングチームの上級管理職の一員であることを反映していません。

SEOとして、これはあなたの心を鼓動させるはずです。

ダニーは、私たち(SEOコミュニティ)がポールを迎えることがどれほど幸運であるかを繰り返します。 そして、彼女のツイートからわかるように、レイはこれがすべてのSEOが詳細に監視し、メモを取る必要があるものであると強く信じています。 私は誰と主張しますか?

プレゼンテーションの取材を書くことは、メモを取ることよりもさらに多くのことを教えてくれることがよくあります。それは、それをさらに一歩進めて、他の人が理解して評価できるメモを書く必要があるからです。 それは批判的思考のさらに別の層を追加します。

自分で資料をよりよく理解し、プレゼンテーションをより早く消化できるようにするために、まさにそれを行うことにしました。 ウィンウィン、そうですか? 注:レイはここに彼女自身のメモと報道を持っています。

全体に埋め込まれるビデオをフォローすることをお勧めします。 以下に、SlideshareからのPaulのプレゼンテーションも埋め込みました。これから静止画像をクリップして投稿し、取材に添えます。

Googleのしくみ:検索マーケティングエキスポのPaulHaahrによるランキングエンジニアの視点-SMX

座って楽しんで、あなたの考えを教えてください。

入りましょう。

注:エマヌエーレヴァッカリは、彼自身の考えとともに、この投稿をイタリア語に翻訳しました。 彼の翻訳された投稿はここで見ることができます。

Googleランキングエンジニアが行うこと

私は実際に、カバレッジに関する独自のルールの1つをすぐに破り、時系列の順序を無視します(ただし、今のところだけです。このセクションの後で、時系列でプレゼンテーションを行います)。

私の意見では、ポールは彼のプレゼンテーション全体に埋め込まれたテーマを持っていて、それが彼のプレゼンテーションのバックボーンとして機能しました。 そのテーマは「ランキングエンジニアは何をするのか」です。

Paulによると、この回答には4つのバージョンがあり、それぞれがランキングエンジニアの役割をわずかに洗練しています。

  1. それらの[Googleの検索]サーバーのコードを記述します。 出典:スライド16
  2. 新しい信号を探します。 古い信号を新しい方法で組み合わせます。 出典:スライド19
  3. 指標[関連性/検索者の意図と品質]に合わせて最適化します。 出典:スライド24
  4. [ライブ実験と人間の評価者からの]良い評価の結果を上に移動します。 悪い評価の結果を下に移動します。 出典:スライド55

括弧[]は、ポールのスライドを(不完全に)明確にするための私自身の感動詞を示していることに注意してください。

では、Googleランキングエンジニアは何をするのでしょうか? 私が受け取った主なポイント:ユーザー(人間)の検索が実際に改善されていることを確認してください。 そして、彼らはそれをどのように行うのですか? Googleを検索品質評価ガイドラインとより一致させることによって。

PaulからRaeへのその後のツイートでは、検索品質評価ガイドラインの重要性が強調されており、SEOは実際にはドキュメント全体を読む必要があります。

ポールのプレゼンテーションからの私の絶対的なお気に入りの引用は、彼が16:08の時点でGoogleの検索品質評価ガイドラインについて話していたときに来ました。 引用自体は、プレゼンテーションのスライド32の16:48分のマークからのものです。 ポールは言った:

「なぜグーグルが何かをしているのか疑問に思っているなら、多くの場合、答えはそれを評価者のガイドラインが言っているように[検索]することです。」

SMX West 2016、Googleランキングエンジニア、Paul Haahr

それは強力な声明です。 Paulは、Googleでのすべての変更を、公開されている検索品質評価ガイドラインにさらに一致させようとしていると要約しています。 簡単に言えば、Googleを理解したいですか? 彼らの品質ガイドラインを読んでください。

さて、ポールのプレゼンテーションの時系列の報道に飛び込みましょう。

今日のGoogle検索

ポールによると、今日のグーグル検索には2つのテーマがあります。

  1. モバイルファースト
  2. 特徴

モバイルは検索クエリをリードしており、Googleはますますモバイルを第一に考えています。 これはSEOにとって新しい情報ではありませんが、Paulが強調したことです。

Paulが強調した2番目のポイントは、特にモバイルにおける機能の重要性でした。

Google_features_slide.png

スライド4

興味深いことに、ポールは今日の検索の要約で次のように述べています。

「私たちは、検索があなたの人生のすべての部分のアシスタントとして考えられている世界にますます入り込んでいます。」

SMX West 2016、Googleランキングエンジニア、Paul Haahr

Google検索のしくみ

グーグルのすべては10の青いリンクでした。 ポールは、10のブルーリンク時代のランキングの問題を「どのドキュメントを表示しますか?どの順序で表示しますか?」と分解しました。

Google_10_blue_links_ranking.png

スライドセブン

興味深いことに、ポールは少し時間を取って、広告のトピックに触れないことを明確にしました。 具体的には、ポールは言った:

「広告は素晴らしいです、彼らは私たちにたくさんのお金を稼ぎます、彼らは広告主にとって非常にうまくいきます。しかし私の仕事、私たちは明確に言われています」広告への影響について考えないでください、収入への影響について考えないでください-ユーザーを助けることを考えてください。」

SMX West 2016、Googleランキングエンジニア、Paul Haahr

教会と国家の明確な分離について聞くのは興味深いです-すみません、有給で有機的です。

クエリの寿命

Paulのランキングの説明は、検索がどのように機能するかを説明するために、クエリの存続期間から始まります。 検索エンジンには2つの部分があります。

  1. 事前に(クエリの前に)
  2. クエリ処理。

クエリの前:

  • ウェブをクロールする
  • クロールページを分析する
    • リンクの抽出(クラシックバージョンの検索)
    • コンテンツをレンダリングする(Javascript、CSS-Paulはこれの重要性を強調しました。)
    • セマンティクスに注釈を付ける
  • インデックスを作成する
    • 本の索引をリンクする
    • 単語ごとに、それが表示されるページのリスト
    • 数百万ページに分割
      • これらのページは「シャード」と呼ばれます
      • Webインデックス用の数千のシャード
    • さらに、ドキュメントごとのメタデータ。

出典:スライド10および11。

クエリ処理(誰かが検索を使用する場合):

  • クエリの理解と拡張
    • クエリは既知のエンティティに名前を付けていますか?
    • 有用な同義語はありますか?
    • コンテキストが重要
  • 検索とスコアリング
    • すべてのシャードにクエリを送信します
    • 各シャード:
      • 一致するページを検索します
      • クエリ+ページのスコアを計算します
      • スコアで上位Nページを送り返します
    • すべてのトップページを組み合わせる
    • スコアで並べ替え
  • 検索後の調整
    • ホストクラスタリング(同じドメインからのページ数)、サイトリンク
    • 重複が多すぎませんか?
    • スパムの降格、手動アクションの適用d

出典:スライド12、13、14、および15。

Googleスコアリングシグナル

Paulは、クエリとページの一致を表す単一の数値を指します。

これは、次の2つのカテゴリに基づくスコアリング信号に基づいています。

  1. ページに基づくスコアリング信号
  2. クエリに基づいて信号をスコアリングします。

Google_Scoring_signals.png

スライド18

ここでPaulは、ランキングエンジニアの仕事のバージョン2を引用しました。新しいシグナルを探すか、古いシグナルを新しい方法で組み合わせます。 パウロはこれを「大変で面白い」と表現しました。

ランキングの主要な指標:関連性、品質、結果が出るまでの時間

Paulは、検索結果の主要な指標として関連性を強調しました。 関連性は基本的に「ユーザーの意図の一致」として説明されました。

Paulは、関連性を「私たちのトップラインメトリック」および「大きな内部メトリック」と呼んでいます。

他にも2つあります。品質と結果が出るまでの時間です(速いほど良い)。 このプレゼンテーションでは、関連性と品質に焦点が当てられました。

相互ランク重み付け

CTR(クリックスルー率)は、特に検索ランキングについて、SEOでよく議論されます。 オーガニックでトップの結果になることと、ナンバー2になることの価値は何ですか? 4番目であるのか? これはしばしば議論され議論されます。 ポールは、価値の観点から、グーグルの見解を説明した。

彼はこのアイデアを「相互にランク付けされた重み付け」と定義しました。

reciprocal_rank_weighting.png

スライド23

明確にするために、ポールはクリック率について話していませんでした。 むしろ、検索ページ全体を評価する内部メトリック。

このアイデアは、各ポジションの価値が50%分散していることを表しており、1位は10位の10倍の価値があります。

かなり魅力的です。

そしてこれにより、ポールはGoogleランキングエンジニアが行うことのバージョン3になりました。それは、指標[関連性と品質]を最適化することです。

ranking_engineers_optimize_metrics.png

スライド24

Googleは検索結果をどのように評価しますか?

Paulは、Googleが特定の結果の有効性を分析する方法は2つあると説明しています。

  1. ライブ実験
  2. 人間の評価者。

以下のビデオ:

ライブ実験

Googleは実際のトラフィックに対してライブA / Bテストを実行し、クリックパターンの変化を探します。

「私たちはたくさんの実験を行っています。Googleで検索を行い、少なくとも1つの実験に参加していない場合は非常にまれです。」

SMX West 2016、Googleランキングエンジニア、Paul Haahr

ポールは、ライブ実験の解釈は難しい作業であることを説明するのに少し時間がかかります。

彼の主な例(以下)は、回答ボックスを使用した結果です。 従来、検索者がクリックしてサイトにアクセスした場合、それは良い結果と見なされていました。 しかし、検索者が答えを見て満足し、締めくくった場合はどうなるでしょうか。 従来、これは悪い結果として評価されていましたが、この場合、実際には良い結果になる可能性があります。

Interpreting_live_search_experiments.png

スライド30

Paulの例のポイントは、検索者の満足度の分析がいかに難しいかを示すことです。

Googleでの人間の評価者の実験

この部分からの最も重要なポイントは、ここでもモバイルファーストが強調されており、人間による評価者の実験の大部分はスマートフォンで行われていることです。

人間の評価者の実験は次のように機能します。

  1. 実在の人物に実験的な検索結果を表示する
  2. 結果がどれほど良いかを尋ねます(関連性と品質の両方のスライド率)
  3. 評価者全体の評価を集計する

繰り返しになりますが、Googleが検索品質評価ガイドラインを公開していることに注意することは非常に重要です。

真剣に、そのクリップを見てください。

検索品質評価者の評価の例

Paulは、16:56マークから、検索品質評価実験の例とスクリーンショットの確認を開始します。

ポールがスライドに大きく依存しているので、この部分のビデオを見ることをお勧めします。 続いて、プレゼンテーションのこの部分はスライド33から始まります。

結果を判断するための2つの尺度:関連性と品質

結果の品質を判断するためにGoogleが評価者に提供する2つの尺度があります。

  1. 会う必要がある(関連性)
  2. ページ品質

Judging_search_results.png

スライド35

モバイルファーストの実験

ポールはまた、モバイルファーストを強調しています。

彼らは5つの方法でこれを達成します:

  1. 関連性の説明はすべて、モバイルユーザーのニーズに関するものです。
  2. モバイルクワイアは、実験で2倍使用されます。
  3. ユーザーの場所は実験に含まれています。
  4. このツールは、モバイルユーザーエクスペリエンスを表示します。
  5. 評価者はスマートフォンを使用してWebサイトにアクセスします。

これがどれほど重要かは強調できません。 グーグルは明らかにモバイルに真の重点を置いています。 ここには妥協点はありません。

会った評価が必要-関連性評価

関連性には5つの異なるカテゴリがあり、「満たす必要がある」と定義されています。

  1. 完全に会う
  2. 非常に会う
  3. 適度に会う
  4. 少し会う
  5. 会うことができません。

評価者5つのオプションだけで判断するわけではないことに注意することが重要です。評価者に、これらの評価の中間のどこにでも着地できるスライディングスケールが表示されます。

スライド41から始めて、ポールは各評価の例を説明します。

Googleのしくみ:検索マーケティングエキスポのPaulHaahrによるランキングエンジニアの視点-SMX

付随するビデオは次のとおりです。

重要なポイント:

  1. 「完全に一致する」は、クエリが明確であり、ユーザーがクエリで意図しているものを完全に満たすことができる結果がある場合にのみ存在できます。
  2. 「非常に満たす」では、ユーザーの意図を満たすために、2つの特定の個別の結果が必要になる場合があります。
  3. 「適度に会う」は一般的に良い情報です。
  4. 「わずかに会う」は許容されますが、優れた情報ではなく、表示する結果が改善されることを願っています。
  5. 「会えない」は笑えるもので、ポールは検索のバグが悪い結果を返すと述べています。

ページ品質評価

Googleは、ページの品質を説明するために3つの重要な概念を検討しています。

  1. 専門知識
  2. 権威
  3. 信頼性。

品質のスケールは高いものから低いものまであります。

高品質のページ:

  • 満足のいく量の高品質なメインコンテンツ。
  • 専門知識、権威、信頼は明らかです。
  • このウェブサイトは評判が良い。

high_quality_pages_according_to_Google.png

スライド50

低品質のページ:

  • コンテンツの品質が低い
  • メインコンテンツはあまりありません
  • 専門知識や権限は表示されません
  • ウェブサイトの評判が悪い
  • 二次コンテンツ(広告)は気が散っています。

Low_quality_pages_according_to_Google.png

スライド51

検索品質メトリクスの最適化

数百人のコンピューター科学者がランクエンジニアリングで働いています。 これらは、指標とシグナルに焦点を当て、継続的な実験を実行し、多くの変更を加えます。これらはすべて、Googleの検索結果を改善するためです(そして、検索品質評価ガイドラインをより正確に反映します。

開発プロセスは、ソフトウェア開発プロセスにとってかなり標準的です。

Google_ranking_development_process.png

スライド54

重要なハイライト:

  1. このプロセスは、コードのテストに数週間から数か月かかる場合があります。
  2. クオンツアナリスト(基本的には統計家)がデータを確認します。 彼らはランキングエンジニアを正直に保ち、変化のほとんど偏りのない分析を提供します。
  3. ローンチレビューパネルは、プロジェクトの概要をレビューし、ドキュメントとレポートをレビューし、ランキング変更のメリットについて議論します。
  4. 更新を実際にライブでプッシュすることは、コードがアルゴリズムに対してどれだけ準備ができているかに応じて、速くなることも遅くなることもあります。

ランキングエンジニアは、主に良い評価の結果を上に移動し、悪い評価の結果を下に移動するためにこれらの更新を作成します。

開発プロセスで何がうまくいかないか

パウロは2種類の問題について話します:

  1. 体系的に悪い評価。
  2. 関心のある概念を捉えていない指標。

体系的に悪い評価

Paulは[テキサスファーム肥料]の例を使用しています。 これは肥料のブランドであることが判明しましたが、Googleはメーカーを返還していました。 人々が実際にメーカーへの地図を望んでいる可能性は低く、むしろ実際の製品を見たいと思っています。 ただし、人間の評価者は、これを「ニーズを非常に満たす」結果として一貫して評価しています

これにより、実際にはマップを追加するパターンが発生し、実際には高い評価の結果が作成されましたが、実際にはライブ検索エクスペリエンスが低下していました。

不足している指標

Paulは、Googleが2008年から2011年に品質に関して抱えていた問題を引用しています。 具体的には、コンテンツファームの問題です。

コンテンツファームは、低品質で関連性の高いコンテンツを作成できます。 これは、実際には低品質である高評価の結果につながりました。 コンテンツファームは、結果の品質を判断するために、Googleが有人評価実験で2番目のスライダーを実装することにつながったものです。

Paulがコンテンツファームの問題と検索品質への影響について話し合い、検索結果の有効性を判断するための別の指標を実装することで問題がどのように克服されたかを聞くのは非常に魅力的です。

また、ここにパンダについての言及がないことも魅力的です。これは、Googleがコンテンツファームをアルゴリズムで処理した方法です。

Paulによると、欠落しているメトリックの解決策は、評価者のガイドラインを修正するか、新しいメトリックを開発することです(必要な場合)。

fix_rater_guidlines_and_develop_new_metrics.png

スライド67

そして、それはポールのプレゼンテーションの全体です!

最終的な考えとポイント

この長い投稿を締めくくる最後の考えをいくつかご紹介します。

  1. 私は、検索品質評価者ガイドラインを後でではなく早く読むつもりです。 あなたもすべき。 Paulは、検索ランキングで行われたすべての変更はそのドキュメントを反映する必要があることを強調しました。 Googleのランキングを理解したいですか? (SEOとして、答えは「YES!」と聞こえるはずです)次に、そのドキュメントを読みます。
  2. Googleは本当にモバイルファーストです。 すべての人間の評価者の実験は、驚くべき程度に、モバイルファーストの体験を非常に強調しています。
  3. ほぼすべての検索には、ライブ実験が含まれています。
  4. 関連性は、Googleの最大の指標です。 彼らは「関連性」を検索内のユーザー(人間)のニーズを満たすこととして定義しています。 上位にランク付けしたい場合は、検索者の期待とニーズを満たすことを検討してください。
  5. Googleは、最初の結果を大幅に重視しています。 後続の各結果は、前の結果の値の50%低下します。 結果#1は、結果#10の10倍の価値があると考えています。

他にも重要なポイントがあると思いますが、私の脳は公式に揚げられています。 フィードバックは大歓迎です—あなたが報道を楽しんだことを望みます。