机器学习和 SEO 竞争对手研究

已发表: 2021-08-03

许多 SEO 专业人士正在2021 年学习 Python 和其他脚本语言,以提高他们的水平。 SEO 行业的另一个相关趋势是机器学习。 机器学习或 ML 可以帮助您进行竞争对手研究等。 我们将告诉您如何使用机器学习进行竞争对手研究并使您的工作更轻松。

机器学习和 SEO 竞争对手研究

机器学习的定义

机器学习是人工智能(AI) 和计算机科学的一个分支,它使用数据和算法来模仿人们的学习方式。 它的工作原理是探索数据和分析模式。

为什么机器学习对于 SEO 目的很重要

许多优秀的 SEO 专家所做的一件事是分析搜索引擎结果页面 (SERP) 及其竞争对手,看看他们正在做什么以获得高排名。 过去,SEO 使用电子表格来收集和分析来自 SERP 的数据,各个列包含不同的数据,如链接数、字数等。虽然这种策略确实有效,但 Excel 的功能有限,即使是你知道像 INDEX + MATCH和 VLOOKUP这样的技巧 此外,现在有更复杂的因素会影响搜索排名,例如移动可用性、社交媒体、页面速度、模式标记等。

然而,现在有像 Python/R 这样的工具可以帮助您一次处理数百万行信息。 您可以在竞争对手数据上使用机器学习来学习:

  • 哪些排名因素导致了网站排名的差异
  • 制胜标杆
  • 就排名而言,因子的单位变化值多少

机器学习和搜索引擎优化

用于竞争对手分析的 ML 问题

ML 解决了几个不同的问题,例如对事物进行分类,称为分类,或预测连续数,称为回归。 为了执行竞争对手分析,您需要一个回归问题。 这是因为竞争对手的 SEO 质量由其 Google 排名表示,这是一个连续的数字。

结果指标

现在我们知道 ML 问题是回归,结果指标是排名。 这是因为排名不受季节性影响,而且竞争对手的排名是第三方数据,您可以使用 SEO 工具和软件找到这些数据,而不是您无法获得的用户流量和转化率。

特征

现在我们知道了结果指标,现在我们需要确定特征或自变量。 特征的数据类型各不相同。 例如,以秒为单位测量的第一次绘制将是一个数字。 积极、中性和消极类别的情绪将是一个因素。 您将希望涵盖尽可能多的排名因素,例如技术、内容、用户体验等,以便进行最全面的研究。

如何做数学

由于排名是数字,您需要用数字来解释排名的差异。 你可以这样做:

排名 ~ w_1*feature_1 + w_2* + … + w_n*

波浪号 (~) 表示“解释者”,n 是第 n 个特征,w 是特征的权重。

什么是机器学习

如何使用机器学习来发现竞争对手的秘密

现在您知道如何进行数学计算,您已经准备好了解机器学习如何帮助您发现有关您的竞争对手的更多数据。 我们假设此时您已经收集了您的 SERPS 数据(“serpa_data”)并且它已经被加入、转换、清理并准备好进行建模。 您的数据至少需要包含您要测试的 Google 排名和特征数据。 您的列可能包括:

  • Google_rank
  • Page_Sspeed
  • Flesch_kincaid_reading-Ease
  • 情绪
  • 站点深度
  • Amp_version_available
  • Internal_page_rank
  • 引用_域_计数
  • Avg_domain_authority_backlinks
  • title_keyword_string_distance

如何训练你的机器学习模型

为了训练您的模型,您需要使用 XGBoost,因为它比其他 ML 模型提供更好的结果。 如果您想尝试替代方案,您可以信任 RandomForest、Adaboost 或 LightGBM 来处理大型数据集。

以下是您如何将 Python 代码用于 SERPS 数据集的 XGBoost。 请记住,这是一个基本示例。 对于真实的客户,您将希望在训练数据样本上尝试各种模型算法,进行评估,然后选择最佳模型。

导入库

第一步是使用以下代码导入库:

将 xgboost 导入为 xgb

将熊猫导入为 pd

serps_data = pd.read_csv('serps_data.csv')

设置模型变量

# 除了 google_rank 列之外的所有内容的 SERP 数据

serp_features = serps_data.drop(columns = ['Google_rank'])

#您的 SERP 数据仅包含 google_rank 列

rank_actual = serps_data.Google_rank

实例化模型

serps_model = xgb.XGBRegressor(objective='reg:linear', random_state=1231)

拟合模型

serps_model.fit(serp_features, rank_actual)

生成模型预测

rank_pred = serps_model.predict(serp_features)

评估模型精度

mse = mean_squared_error(rankactual, rank_pred)

如何使用机器学习进行 SEO

你可以从数据中学到什么

您可以从模型中学到以下几点:

排名最具预测性的驱动因素

数据将按重要性告诉您最具影响力的 SERP 功能或排名因素。 每个市场或行业都会有所不同。

排名因素值多少

您还可以查看将根据每个因素提供多少排名。

排名因素的获胜基准

数据还将告诉您每个排名因素的获胜基准。 例如,尽管您可能会为每个排名因素遵循某些通用 SEO 规则,但每个因素的实际基准可能因市场或行业而异。

您可以使用这些数据来帮助您优化内容,从而在 SERP 中击败竞争对手。

如何使用机器学习自动化您的 SEO 竞争对手分析

虽然对 SEO 竞争对手数据的 ML 分析很重要,但它在进行中时会更有帮助。 一次性机器学习分析对于 SERP 来说只是一个时刻,因为SERP 总是在变化和发展,谷歌的算法也是如此 然而,持续的数据收集和分析流让您可以更好地全面了解 SERP 上真正发生的事情——以及为什么——在您的行业(或您的客户)。这就是为什么您自动化您的 SEO 竞争对手的关键用机器学习进行分析。

这就是 SEO 专用数据仓库和仪表板系统的用武之地。这些系统每天从您选择的 SEO 工具中获取您的数据,合并数据,并使用机器学习在您选择的前端应用程序(如Google)中分享见解数据工作室

为了构建您自己的自动化系统,您需要在所谓的 ETL(即提取、转换和加载)中部署到云基础设施(如 Amazon Web Services 或 Google Cloud Platform)中。 提取是指您的 SEO 工具 API 的日常调用。 转换是对数据的清理和分析。 加载是将完成的结果存入您的数据仓库。 这使您可以在一个地方自动化数据收集、分析和可视化。

机器学习

机器学习和 SEO 竞争对手研究

进行 SEO 竞争对手研究可能很困难,但机器学习可以帮助您更轻松,特别是如果您将过程自动化。 当您对竞争对手使用机器学习时,您可以了解关键驱动因素是什么,确定其中的获胜基准,并了解您的优化可以提供多少排名提升。 如果您需要使用机器学习进行 SEO 竞争对手研究的帮助,请立即联系 SEO Design Chicago,我们的 SEO 专家可以为您提供帮助。

常见问题:

  • 什么是机器学习?
  • 如何设置机器学习模型?
  • 关于竞争对手研究的 ML 模型需要哪些数据?
  • 机器学习如何帮助我的 SEO 竞争对手研究?
  • 如何自动化机器学习以进行 SEO 竞争对手研究?