機械学習とSEO競合他社の研究
公開: 2021-08-03多くのSEO専門家は、ゲームを向上させるために2021年にPythonやその他のスクリプト言語を学んでいます。 SEO業界のもう1つの関連する傾向は、機械学習です。 機械学習(ML)は、競合他社の調査などに役立ちます。 機械学習を使用して競合他社の調査を実施し、仕事を簡単にする方法を説明します。

機械学習の定義
機械学習は、人工知能(AI)とコンピューターサイエンスの分野であり、データとアルゴリズムを使用して人々の学習方法を模倣します。 データを探索し、パターンを分析することで機能します。
SEOの目的で機械学習が重要である理由
多くの優れたSEO専門家が行うことの1つは、検索エンジンの結果ページ(SERP)とその競合他社を分析して、上位を獲得するために何をしているのかを確認することです。 これまで、SEOはスプレッドシートを使用してSERPからデータを収集および分析し、さまざまな列にリンク数や単語数などのさまざまなデータが含まれていました。この戦術は機能しますが、Excelで実行できることは限られています。あなたはINDEX + MATCHやVLOOKUPのようなトリックを知っています。 さらに、モバイルユーザビリティ、ソーシャルメディア、ページ速度、スキーママークアップなど、検索ランキングに影響を与えるより複雑な要素があります。
ただし、現在では、Python / Rのように、数百万行の情報を一度に処理するのに役立つツールがあります。 競合他社のデータで機械学習を使用して、次のことを学習できます。
- ウェブサイトのランキングの違いを説明するランキング要因はどれか
- 優勝ベンチマーク
- ランク付けの観点から、係数の単位変更の価値はどれくらいですか

競合他社の分析のためのML問題
MLは、分類と呼ばれるものの分類や、回帰と呼ばれる連続数の予測など、いくつかの異なる問題を解決します。 競合他社の分析を実行するには、回帰問題が必要になります。 これは、競合他社のSEOの品質が、連続した数値であるGoogleランキングによって示されるためです。
結果の指標
MLの問題が回帰であることがわかったので、結果の指標はランクです。 これは、ランクが季節性の影響を受けず、競合他社のランクがサードパーティのデータであり、ユーザーのトラフィックやコンバージョンではなく、SEOツールやソフトウェアを使用して見つけることができるためです。
特徴
結果のメトリックがわかったので、次に、特徴または独立変数を決定する必要があります。 機能のデータ型は異なります。 たとえば、秒単位で測定された最初のペイントは数値になります。 ポジティブ、ニュートラル、ネガティブのカテゴリーでの感情が要因になります。 最も包括的な調査を実施するには、技術、コンテンツ、ユーザーエクスペリエンスなど、できるだけ多くのランキング要素をカバーする必要があります。
数学を行う方法
ランキングは数値であるため、ランクの違いを数値で説明する必要があります。 あなたはこれを行うことができます:
ランク〜w_1 * feature_1 + w_2 * +…+ w_n *
チルダ(〜)は「によって説明される」を意味し、nはn番目の特徴、wは特徴の重みです。

機械学習を使用して競合他社の秘密を発見する方法
数学の方法がわかったので、機械学習が競争に関するより多くのデータを発見するのにどのように役立つかを確認する準備が整いました。 この時点で、SERPSデータ(「serpa_data」)が収集され、結合、変換、クリーンアップされ、モデリングの準備ができていると想定します。 データには、少なくともテストするGoogleのランキングと機能のデータが含まれている必要があります。 列には次のものが含まれる場合があります。
- Google_rank
- Page_Sspeed
- Flesch_kincaid_reading-使いやすさ
- 感情
- Site_depth
- Amp_version_available
- Internal_page_rank
- Referring_domains_count
- Avg_domain_authority_backlinks
- Title_keyword_string_distance
機械学習モデルをトレーニングする方法
モデルをトレーニングするには、他のMLモデルよりも優れた結果が得られるXGBoostを使用することをお勧めします。 別の方法を試したい場合は、大規模なデータセットに対してRandomForest、Adaboost、またはLightGBMを信頼できます。

SERPSデータセットのXGBoostにPythonコードを使用する方法は次のとおりです。 これは基本的な例であることに注意してください。 実際のクライアントの場合、トレーニングデータサンプルでさまざまなモデルアルゴリズムを試し、評価してから、最適なモデルを選択する必要があります。
ライブラリをインポートする
最初のステップは、次のコードでライブラリをインポートすることです。
xgboostをxgbとしてインポートします
パンダをpdとしてインポートする
serps_data = pd.read_csv( 'serps_data.csv')
モデル変数を設定する
#google_rank列以外のすべてのSERPデータ
serp_features = serps_data.drop(columns = ['Google_rank'])
#google_rank列だけのSERPデータ
rank_actual = serps_data.Google_rank
モデルをインスタンス化する
serps_model = xgb.XGBRegressor(objective = 'reg:linear'、random_state = 1231)
モデルを合わせる
serps_model.fit(serp_features、rank_actual)
モデル予測を生成する
rank_pred = serps_model.predict(serp_features)
モデルの精度を評価する
mse = mean_squared_error(rankactual、rank_pred)

データから学べること
モデルから学ぶことができることは次のとおりです。
ランクの最も予測的なドライバー
データは、最も影響力のあるSERP機能または重要度の高い順にランク付けされた要素を示します。 すべての市場または業界は異なります。
ランキング要素の価値
また、各要素に基づいて配信されるランクを確認することもできます。
ランキングファクターの勝利ベンチマーク
データは、各ランキング要素の勝利ベンチマークも示します。 たとえば、各ランキング要素について従う特定の一般的なSEOルールがある場合でも、各要素の実際のベンチマークは市場や業界によって異なる場合があります。
このデータを使用して、SERPでの競争に打ち勝つためにコンテンツを最適化することができます。
機械学習を使用してSEO競合他社の分析を自動化する方法
SEO競合他社のデータのML分析は重要ですが、進行中の場合はさらに役立ちます。 Googleのアルゴリズムと同様に、SERPは常に変化し、進化しているため、1回限りの機械学習分析はSERPにとってほんの一瞬です。 ただし、データ収集と分析の継続的なストリームにより、SERPで実際に何が起こっているのか、そしてその理由を業界(またはクライアント)でよりよく把握できます。これが、SEOの競合他社を自動化することが重要である理由です。機械学習による分析。
そこで、SEO専用のデータウェアハウスとダッシュボードシステムが登場します。これらのシステムは、選択したSEOツールから毎日データを取得し、データを結合し、機械学習を使用して、 Googleなどの選択したフロントエンドアプリケーションで洞察を共有します。データスタジオ。
独自の自動システムを構築するには、Amazon WebServicesやGoogleCloud Platformなどのクラウドインフラストラクチャに、いわゆるETL、別名抽出、変換、読み込みでデプロイする必要があります。 抽出とは、SEOツールAPIを毎日呼び出すことです。 変換とは、データのクリーニングと分析です。 ロードとは、完成した結果をデータウェアハウスに保管することです。 これにより、データの収集、分析、および視覚化を1か所で自動化できます。

機械学習とSEO競合他社の研究
SEOの競合他社の調査を実施するのは難しい場合がありますが、特にプロセスを自動化する場合は、機械学習を使用すると簡単になります。 競合他社で機械学習を使用すると、主要な推進要因が何であるかを学び、それらの間で勝利のベンチマークを特定し、最適化によってどれだけランクが上がるかを学ぶことができます。 SEO競合他社の研究に機械学習を使用する際のサポートが必要な場合は、今すぐSEO DesignChicagoにご連絡ください。SEOの専門家がお手伝いします。
よくある質問:
- 機械学習とは何ですか?
- MLモデルを設定するにはどうすればよいですか?
- 競合他社の研究に関するMLモデルにはどのようなデータが必要ですか?
- 機械学習は、SEOの競合他社の調査にどのように役立ちますか?
- SEO競合他社の研究のために機械学習を自動化するにはどうすればよいですか?
