Google 如何查找 App Store 垃圾邮件

已发表: 2017-11-01

Google 正在 Play 商店中可用的应用程序中寻找应用程序商店垃圾邮件。

申请专利查找 App Store 垃圾邮件

我喜欢查看涉及搜索和网络的专利,因为它们解释了搜索引擎试图解决的问题。 这些专利向我们展示了旨在解决这些问题的发明。 有时,他们向我们展示了某人如何通过研究其他公司如何解决类似问题来学习解决他们的问题。

本月,一项谷歌专利获得批准,可以发现应用商店的垃圾邮件。 随着 Google 发明并运行 Android 操作系统,它为在 Android 设备上运行的应用程序开发了一个市场。 作为苹果的竞争对手,它有很多东西要向苹果学习。 谷歌专利提到了专利申请人引用的几篇可能影响他们写作的文章。 阅读这些是对专利的一个很好的介绍。

有趣的是,这些文章关注的是 Apple App Store,而不是 Google 运营的 App Store。 谷歌也会考虑 Apple App Store 可能不得不帮助他们运行自己的 App Store 的问题,这是有道理的。

这些文章中的第一篇名为《识别 iOS 应用商店中的垃圾邮件》

这篇论文的摘要告诉我们有关人们向 Apple App Store 发送垃圾邮件的应用程序和问题:

Apple iOS App Store 上的热门应用程序可以产生数百万美元的利润并收集有价值的个人用户信息。 欺诈性评论可能会欺骗用户下载可能有害的垃圾邮件应用程序,或不公平地忽略成为评论垃圾邮件受害者的应用程序。 因此,自动识别 App Store 中的垃圾邮件是一个重要的问题。 本文旨在介绍和表征通过爬取 iOS App Store 获取的新数据集,将基线决策树模型与用于应用垃圾邮件分类的新潜在类图形模型进行比较,并分析聚类评论的初步结果。

在这篇论文的介绍中,我们被告知更多关于垃圾邮件应用程序的问题:

垃圾邮件应用程序的开发人员(恶意开发人员)主要对获取货币利润或泄露有价值的用户数据(例如地址簿联系人)感兴趣。 流行的、看似合法的应用程序可以悄悄地泄漏用户数据 [2, 4],因此垃圾邮件应用程序也有可能尝试这样做。

看看别人遇到的问题,可以学到很多东西:

恶意开发人员可以使用多个一次性 iTunes 用户帐户(即“sockpuppets”)发布垃圾评论。 Apple 试图通过要求用户在能够查看应用程序之前购买和下载应用程序来降低垃圾邮件的频率。 但是,仍然可以使用 iTunes 礼品卡创建 sockpuppet 用户帐户,并且潜在的盈利和被盗用户数据可以证明成本是合理的。

这篇论文告诉我们,他们致力于识别垃圾邮件。 他们通过查看 App Store 中涉及垃圾邮件行为的评论模式来做到这一点。

另一篇论文告诉我们苹果试图做的其他一些事情来识别垃圾邮件行为:

苹果可能调整了 App Store 排名算法,让下载变得不那么重要

有趣的是,本文还讨论了 Android 商店中的 App:

根据以青少年为中心的社交网络 MyYearbook,谷歌最近几周可能已经开始更重地衡量应用的日活跃用户与月活跃用户的比率——衡量粘性的一个指标。 该公司注意到其整个应用程序组合中的可疑排名波动。 谷歌没有对此发表评论。

我们被告知,在某个时间点,下载曾经在 Apple Store 中非常重要。 这是一个重大变化:

这些变化意义重大,因为迄今为止,Apple 应用程序商店的排名在很大程度上依赖于应用程序的下载率。 这使得整个家庭手工业蓬勃发展。 Flurry、Tapjoy 和 W3i 等网络允许开发人员为下载付费,这将他们的应用程序推到排行榜的首位,在那里他们可以通过额外的可见性获得更多的下载量。 如果他们表现出色,他们会保持在图表的顶部。 如果它们是坏的,它们很快就会倒下。

谷歌专利是:

检测应用商店排名垃圾邮件
发明人:朱开华、吴平
受让人:GOOGLE INC.
美国专利:9,794,106
授予时间:2017 年 10 月 17 日
提交时间:2013 年 3 月 4 日

抽象的

可以被配置为管理向用户分发内容的服务器可以接收与特定用户相关联的内容相关信息并分析内容相关信息。 这种分析可以包括将内容相关信息中的参数与服务器中相应的预定义参数进行比较,以确定可接受的内容相关活动并基于对内容相关信息的分析对用户进行分类。 内容相关信息可以包括内容使用相关数据、内容下载相关度量或用户会话相关度量中的一项或多项,这些度量与用户结合经由服务器管理的内容的使用所使用的一个或多个会话有关。

在通读本专利之前先阅读这些文章是有帮助的。 它们提供了一种关于什么处于危险中以及什么发生了变化的感觉,以及为什么专利专注于它所做的事情。

我们被告知,与内容使用相关的数据是重要的指标,包括:

  1. 用户在使用内容期间在电子设备中生成的数据,
  2. 与特定内容的购买或更新数量相关的市场数据,以及
  3. 内容使用活动的第三方数据。

该专利告诉我们有关下载的相关指标,其中包括:

  1. 用户下载的所有内容中特定类型内容的百分比
  2. 一天内下载的最大内容数
  3. 下载的内容总数
  4. 一周内下载的最大内容数

商店可能会考虑的另一件事是寻找应用程序的人在应用程序商店中的行为方式:

与用户会话相关的指标可能包括:

  1. 用户从搜索下载的内容的百分比
  2. 用户发出的若干查询
  3. 从浏览和/或点击下载的内容的百分比
  4. 平均会话持续时间和/或从搜索到下载的延迟
  5. 从直接入站流量下载的内容的百分比。

基于应用程序使用的指标来查找 App Store 垃圾邮件

除了查看人们在应用程序商店中的行为外,运行应用程序的设备还可能收集有关安装这些应用程序的人如何使用这些应用程序的数据。

在专利描述中,我们详细了解了这种方法背后的动机及其工作原理:

例如,对于基于应用程序使用情况的排名和/或垃圾邮件检测,可以根据使用情况而不是总下载数对应用程序进行排名。 在这点上,使用的生成成本可能远高于下载,因此生成应用程序下载垃圾邮件的成本太高而无法持续。 因此,客户端设备可以收集和/或获得与使用相关的度量。 使用相关指标的示例可以包括操作系统(OS)相关指标和/或其他 API 相关信息,例如特定应用程序启动的次数以及用户使用它的时间; 市场指标,例如应用程序更新的次数以及应用程序内购买的次数(因为应用程序市场处理付款); 和第三方数据。 在这点上,专门的第三方应用实体可以收集和/或获得跨越数亿设备的数十万应用使用的应用使用,和/或提供该数据。 应用管理服务器可以最初确定与使用相关的度量的可信度。 一旦确定可信,应用管理服务器可以组合和/或分析所有不同的使用相关信息,这允许更优化地确定普通用户将如何使用特定应用(例如,使用应用的时间),从而应用管理服务器可以相应地对应用程序进行排名(或调整任何现有的排名)。 此外,应用管理服务器可以在关于用户分类的决定中使用排名和/或对排名的调整。

结论:识别异常

该专利还提供了有关如何下载交互和用户会话数据可用于识别垃圾邮件发送者的详细信息。 这些详细信息还有助于确定可能不合法的应用程序。 这是在选择和下载应用程序时可能会审查的用户数据类型:

例如,应用管理服务器可以获取、收集或接收与通过市场搜索框进行的用户搜索查询相关的数据;
在市场页面上点击的链接;
市场页面用户浏览量;
在每一页上花费的时间;
和/或下载、安装的下载事件应用程序用户(购买)。

该专利告诉我们,当用户经历发现阶段并找到应用程序时,也会收集信息,并且他们正在仔细观察异常活动:

对于下载的每个应用程序,应用程序管理服务器可以识别应用程序被下载的原因并且可以生成与该下载对应的一组用户会话相关度量。 应用程序数据分析器然后可以确定整个用户群体的百分比以识别异常。 会话指标的示例可能涉及用户在特定会话期间发出的多个查询(和/或特定时间段内的总查询——例如,每天); 从搜索下载的应用程序的百分比; 从浏览和点击中下载的应用程序百分比; 从直接入站流量下载的应用程序百分比; 平均会话时长; 和/或从搜索到下载的延迟。 因此,获得针对整个用户群的用户会话相关度量可以允许确定适用的预期会话相关标准(例如阈值),这又将用于(例如比较)确定会话度量对应于何处特定用户的应用程序下降(即,与总体用户群相比),因此允许对用户进行分类。

与人们在 App Store 中的行为方式相关的异常行为可以帮助指出可能不是人们想要使用或下载的应用程序。 我们看到谷歌和苹果去年在非常受欢迎的口袋妖怪游戏中取得了成功。 为人们提供流行的应用程序值得努力打击 App Store 垃圾邮件。