GoogleがAppStoreのスパムを見つける方法

公開: 2017-11-01

Googleは、Playストアで利用可能なアプリケーションの中から、Playストアでアプリストアのスパムを探しています。

AppStoreのスパムを見つける特許を取得

私は検索とウェブを含む特許を見るのが好きです。なぜならそれらは検索エンジンが解決しようとしている問題を説明しているからです。 これらの特許は、これらの問題に対処するための解決策として意図された発明を示しています。 時々、彼らは、他の会社が同様の問題にどのように取り組んだかを研究することによって、誰かが彼らの問題を解決することを学ぶかもしれない方法を私たちに示します。

今月、アプリストアのスパムを検出するGoogle特許が付与されました。 GoogleがAndroidオペレーティングシステムを発明して実行することで、Androidデバイスで実行されるアプリのマーケットプレイスを開発しました。 Appleの競争相手として、Appleから学ぶことはたくさんあります。 Google特許は、特許出願人が引用した、執筆に影響を与えた可能性のあるいくつかの記事に言及しています。 それらを読むことは、特許への良い入門書です。

興味深いことに、これらの記事は、Googleが運営しているものではなく、Apple AppStoreに焦点を当てています。 Googleが、Apple AppStoreが独自のAppStoreの運営を支援しなければならなかったかもしれない問題も検討することは理にかなっています。

これらの記事の最初の記事は、iOSアプリストアでのスパムの識別と呼ばれるものです。

このペーパーの要約は、Apple AppStoreをスパムする人々に関連するアプリと問題について説明しています。

Apple iOS App Storeで人気のあるアプリは、数百万ドルの利益を生み出し、貴重な個人ユーザー情報を収集する可能性があります。 不正なレビューは、潜在的に有害なスパムアプリをダウンロードしたり、レビュースパムの被害者であるアプリを不当に無視したりするようにユーザーを欺く可能性があります。 したがって、AppStoreでスパムを自動的に識別することは重要な問題です。 このペーパーは、iOS App Storeをクロールして取得した新しいデータセットを紹介して特徴づけ、ベースラインのディシジョンツリーモデルをアプリスパムの分類のための新しい潜在クラスのグラフィカルモデルと比較し、クラスタリングレビューの予備的な結果を分析することを目的としています。

このペーパーの紹介では、スパムアプリの問題について詳しく説明しています。

スパムアプリの開発者(悪意のある開発者)は、主に金銭的な利益を得たり、名簿の連絡先などの貴重なユーザーデータを漏らしたりすることに関心があります。 人気のある、一見正当なアプリはユーザーデータを静かに漏洩する可能性があるため[2、4]、スパムアプリが同じことを試みる可能性があります。

他の人が経験した問題を見ることから多くを学ぶことが可能です:

悪意のある開発者は、いくつかの使い捨てのiTunesユーザーアカウント、つまり「sockpuppets」を使用してスパムレビューを投稿する可能性があります。 Appleは、ユーザーがアプリをレビューする前にアプリを購入してダウンロードすることを要求することにより、スパムの頻度を減らすことを試みました。 ただし、sockpuppetユーザーアカウントは引き続きiTunesギフトカードを使用して作成でき、利益やユーザーデータの盗難の可能性はコストを正当化する可能性があります。

この論文は、彼らがスパムを特定するために働いたことを示しています。 彼らは、AppStoreでのスパム行為を含むレビューパターンを調べることでこれを行います。

もう1つの論文は、Appleがスパムの振る舞いを特定するために試みた他のいくつかのことについて説明しています。

AppleはAppStoreのランキングアルゴリズムを微調整し、ダウンロードの問題を減らした可能性がある

興味深いことに、このペーパーでは、Androidストアのアプリについても説明しています。

10代に焦点を当てたソーシャルネットワークMyYearbookによると、Androidマーケットのランキングを絶えず調整しているGoogleは、アプリの1日あたりのアクティブユーザーと1か月あたりのアクティブユーザーの比率(粘着性の尺度)をここ数週間でより重視し始めている可能性があります。 同社は、アプリのポートフォリオ全体で疑わしいランキングの変動に気づいていました。 グーグルはこれについてコメントしなかった。

ある時点で、AppleStoreではダウンロードが非常に重要だったと言われています。 これは重要な変更です。

これまでのところ、Apple App Storeのランキングはアプリのダウンロード率に大きく依存しているため、この変更は大きな問題です。 これにより、コテージ業界全体が繁栄することができました。 Flurry、Tapjoy、W3iなどのネットワークを使用すると、開発者はダウンロードの料金を支払うことができます。これにより、アプリがチャートの一番上に表示され、可視性を高めることでさらに多くのダウンロードを取得できます。 それらが良ければ、チャートの一番上に固執します。 彼らが悪い場合、彼らはすぐに落ちます。

Googleの特許は次のとおりです。

アプリケーションストアのランキングスパムを検出する
発明者:KaihuaZhuとPingWu
譲受人:GOOGLEINC。
米国特許:9,794,106
付与:2017年10月17日
提出日:2013年3月4日

概要

ユーザーへのコンテンツの配信を管理するように構成され得るサーバーは、特定のユーザーに関連するコンテンツ関連情報を受信し、コンテンツ関連情報を分析することができる。 そのような分析は、コンテンツ関連情報のパラメータをサーバー内の対応する事前定義されたパラメータと比較して、許容可能なコンテンツ関連活動を決定し、コンテンツ関連情報の分析に基づいてユーザを分類することを含み得る。 コンテンツ関連情報は、サーバーを介して管理されるコンテンツの使用に関連してユーザーによって利用される1つ以上のセッションに関連する1つ以上のコンテンツ使用関連データ、コンテンツダウンロード関連メトリック、またはユーザーセッション関連メトリックを含み得る。

この特許を読む前に、まずこれらの記事を読むと役立ちます。 それらは、何が危険にさらされているのか、何が変わったのか、そしてなぜ特許がそれが行うことに焦点を合わせているのかについての感覚を提供します。

コンテンツの使用に関連するデータは、次の要素で構成される重要な指標であると言われています。

  1. ユーザーによるコンテンツの使用中に電子機器で生成されたデータ、
  2. 特定のコンテンツの購入または更新の数に関連する市場データ、および
  3. コンテンツ使用活動のサードパーティデータ。

この特許は、次のようなものを含むダウンロード関連のメトリックについて教えてくれます。

  1. ユーザーがダウンロードしたすべてのコンテンツからの特定の種類のコンテンツの割合
  2. 1日にダウンロードされるコンテンツの最大数
  3. ダウンロードされたコンテンツの総数
  4. 1週間にダウンロードされるコンテンツの最大数

ストアが見る可能性のあるもう1つのことは、アプリを探している人々がAppStoreでどのように行動するかです。

ユーザーセッション関連の指標には、次のものが含まれます。

  1. ユーザーによる検索からダウンロードされたコンテンツの割合
  2. ユーザーによって発行されたクエリの数
  3. ブラウジングおよび/またはクリックスルーからダウンロードされたコンテンツの割合
  4. 平均セッション時間および/または検索からダウンロードまでの遅延
  5. 直接のインバウンドトラフィックからダウンロードされたコンテンツの割合。

AppStoreスパムを見つけるためのアプリケーション使用量ベースのメトリクス

アプリストアでのユーザーの行動を確認するだけでなく、アプリを実行しているデバイスは、アプリをインストールしたユーザーがそれらのアプリをどのように使用しているかに関するデータを収集する場合があります。

このようなアプローチの背後にある動機とその仕組みの詳細は、特許の説明に記載されています。

たとえば、アプリケーションの使用状況に基づくランク付けやスパム検出を使用すると、アプリケーションは、ダウンロードの総数ではなく、使用状況に基づいてランク付けされる場合があります。 この点で、使用法はダウンロードよりも生成するのにはるかに費用がかかる可能性があり、したがって、アプリケーションのダウンロードスパムを生成するコストは持続可能ではないほどコストがかかります。 したがって、クライアントデバイスは、使用関連のメトリックを収集および/または取得することができる。 使用に関連するメトリックの例には、オペレーティングシステム(OS)に関連するメトリックや、特定のアプリケーションの起動回数やユーザーがそれを使用する時間など、その他のAPI関連の情報が含まれる場合があります。 アプリケーションが更新される回数や、アプリケーション内購入の回数(アプリケーション市場が支払いを処理するため)などの市場指標。 およびサードパーティのデータ。 この点に関して、専門のサードパーティアプリケーションエンティティは、数億のデバイスにわたる数十万のアプリケーション使用量のアプリケーション使用量を収集および/または取得し、および/またはそのデータを提供する場合があります。 アプリケーション管理サーバーは、使用状況に関連するメトリックの信頼性を最初に判断する場合があります。 信頼できると判断されると、アプリケーション管理サーバーは、すべての異なる使用関連情報を組み合わせたり分析したりできます。これにより、平均的なユーザーが特定のアプリケーションをどのように使用するか(たとえば、アプリケーションの使用時間)をより最適に判断でき、アプリケーション管理が可能になります。サーバーは、それに応じてアプリケーションをランク付け(または既存のランク付けを調整)する場合があります。 また、アプリケーション管理サーバーは、ユーザー分類に関する決定において、ランク付けおよび/またはランク付けへの調整を使用することができる。

結論:異常の特定

この特許は、インタラクションをダウンロードする方法の詳細も提供し、ユーザーセッションデータを使用してスパマーを識別できます。 これらの詳細は、正当ではない可能性のあるアプリを特定するのにも役立ちます。 これは、アプリを選択してダウンロードしたときに確認される可能性のあるユーザーデータの種類です。

アプリケーション管理サーバーは、例えば、市場検索ボックスを介して行われたユーザー検索クエリに関連するデータを取得、収集、または受信することができる。
マーケットページをクリックしたリンク。
マーケットページのユーザービュー。
各ページに費やされた時間。
および/またはダウンロードイベントアプリケーションユーザー(購入)がダウンロード、インストールされました。

この特許は、ユーザーが発見段階を経てアプリケーションを見つけたときにも情報が収集され、異常なアクティビティを注意深く監視していることを示しています。

ダウンロードされたアプリケーションごとに、アプリケーション管理サーバーは、アプリケーションがダウンロードされた理由を識別し、そのダウンロードに対応する一連のユーザーセッション関連のメトリックを生成する場合があります。 次に、アプリケーションデータアナライザは、異常を特定するために、ユーザー集団全体のパーセンテージを決定する場合があります。 セッションメトリックの例は、特定のセッション中にユーザーが発行した複数のクエリ(および/または特定の期間の合計クエリ(たとえば、1日あたり))などに関係する場合があります。 検索からダウンロードされたアプリケーションの割合。 ブラウジングとクリックスルーからダウンロードされたアプリケーションの割合。 直接のインバウンドトラフィックからダウンロードされたアプリケーションの割合。 平均セッション時間; および/または検索からダウンロードまでの遅延。 したがって、全体的なユーザー母集団のユーザーセッション関連メトリックを取得することにより、適用可能な予想セッション関連基準(例えば、しきい値)を決定することができ、これは、次に、セッションメトリックが対応する場所を決定する際に使用される(例えば、比較)。特定のユーザーのアプリケーションは(つまり、ユーザー全体の母集団と比較して)分類されるため、ユーザーの分類が可能になります。

App Storeでの人々の行動に関連する異常な行動は、人々が使用またはダウンロードしたいアプリではない可能性のあるアプリを指摘するのに役立ちます。 昨年、非常に人気のあるポケモンゲームでグーグルとアップルの両方が成功したのを見ました。 人気のあるアプリを人々に提供することは、App StoreSpamと戦う努力の価値があります。