Cara Google Menemukan Spam App Store

Diterbitkan: 2017-11-01

Google sedang berburu spam app store di Play store di antara aplikasi yang tersedia di sana.

Paten Menemukan Spam App Store

Saya suka melihat paten yang melibatkan pencarian dan Web karena mereka menjelaskan masalah yang coba dipecahkan oleh mesin pencari. Paten ini menunjukkan kepada kita penemuan yang dimaksudkan sebagai solusi untuk mengatasi masalah tersebut. Terkadang, mereka menunjukkan kepada kita bagaimana seseorang dapat belajar memecahkan masalah mereka dengan mempelajari bagaimana perusahaan lain mengatasi masalah serupa.

Bulan ini, paten Google diberikan yang menemukan spam toko aplikasi. Dengan Google yang menemukan dan menjalankan sistem operasi Android, Google mengembangkan pasar untuk aplikasi yang berjalan di perangkat Android. Sebagai pesaing Apple, ia harus banyak belajar dari Apple. Google Patent menyebutkan beberapa artikel yang dikutip oleh pemohon paten yang mungkin mempengaruhi tulisan mereka. Membaca itu adalah pengantar yang bagus untuk paten.

Menariknya, artikel-artikel tersebut berfokus pada Apple App store, bukan yang dijalankan oleh Google. Masuk akal bahwa Google juga akan melihat masalah yang mungkin dihadapi Apple App Store untuk membantu mereka menjalankan App Store mereka sendiri.

Yang pertama dari artikel ini adalah yang disebut, Mengidentifikasi spam di toko aplikasi iOS

Abstrak dari makalah ini memberi tahu kita tentang aplikasi dan masalah yang terkait dengan orang yang mengirim spam ke Apple App Store:

Aplikasi populer di Apple iOS App Store dapat menghasilkan keuntungan jutaan dolar dan mengumpulkan informasi pengguna pribadi yang berharga. Ulasan palsu dapat menipu pengguna agar mendownload aplikasi spam yang berpotensi berbahaya atau mengabaikan aplikasi yang menjadi korban spam ulasan secara tidak adil. Dengan demikian, mengidentifikasi spam secara otomatis di App Store adalah masalah penting. Makalah ini bertujuan untuk memperkenalkan dan mengkarakterisasi kumpulan data baru yang diperoleh melalui perayapan iOS App Store, membandingkan model Pohon Keputusan dasar dengan model grafis Kelas Laten baru untuk klasifikasi spam aplikasi, dan menganalisis hasil awal untuk ulasan pengelompokan.

Dalam pengantar makalah, kami diberi tahu lebih banyak tentang masalah dengan aplikasi spam:

Pengembang aplikasi spam (pengembang jahat) terutama tertarik untuk mendapatkan keuntungan uang atau membocorkan data pengguna yang berharga, seperti kontak buku alamat. Aplikasi populer yang tampaknya sah dapat membocorkan data pengguna secara diam-diam [2, 4], sehingga mungkin saja aplikasi spam akan mencoba melakukan hal yang sama.

Adalah mungkin untuk belajar banyak dari melihat masalah yang dialami orang lain:

Pengembang jahat dapat memposting ulasan spam dengan menggunakan beberapa akun pengguna iTunes sekali pakai yaitu "sockpuppets". Apple telah berusaha untuk mengurangi frekuensi spam dengan mengharuskan pengguna untuk membeli dan mengunduh aplikasi sebelum dapat meninjaunya. Namun, akun pengguna sockpuppet masih dapat dibuat menggunakan Kartu Hadiah iTunes, dan potensi keuntungan serta data pengguna yang dicuri dapat membenarkan biayanya.

Makalah ini memberitahu kita bahwa mereka bekerja untuk mengidentifikasi spam. Mereka melakukan ini dengan melihat pola ulasan yang melibatkan perilaku spam di App Store.

Makalah lain memberi tahu kami tentang beberapa hal lain yang coba dilakukan Apple untuk mengidentifikasi perilaku spam:

Apple Mungkin Telah Mengubah Algoritma Peringkat App Store, Membuat Pengunduhan Lebih Penting

Menariknya, tulisan ini juga membahas Apps di toko Android:

Google, yang terus-menerus mengubah peringkat Android Market-nya, mungkin mulai menimbang rasio aplikasi dari pengguna aktif harian terhadap pengguna aktif bulanan — ukuran kekakuan — lebih berat dalam beberapa minggu terakhir, menurut jaringan sosial yang berfokus pada remaja MyYearbook. Perusahaan telah memperhatikan fluktuasi peringkat yang mencurigakan di seluruh portofolio aplikasinya. Google tidak mengomentari ini.

Kami diberitahu bahwa pada satu titik waktu, unduhan dulu sangat penting di Apple Store. Ini adalah perubahan yang signifikan:

Perubahan tersebut merupakan masalah besar karena peringkat toko aplikasi Apple hingga saat ini sangat bergantung pada tingkat unduhan aplikasi. Ini telah memungkinkan seluruh industri rumahan untuk berkembang. Jaringan seperti Flurry, Tapjoy, dan W3i memungkinkan pengembang membayar unduhan, yang membuat aplikasi mereka berada di puncak tangga lagu di mana mereka bisa mendapatkan lebih banyak unduhan dengan visibilitas ekstra. Jika mereka bagus, mereka tetap di puncak tangga lagu. Jika mereka buruk, mereka jatuh dengan cepat.

Paten Google adalah:

Mendeteksi spam peringkat toko aplikasi
Penemu: Kaihua Zhu dan Ping Wu
Penerima Tugas: GOOGLE INC.
Paten AS: 9.794.106
Diberikan: 17 Oktober 2017
Diarsipkan: 4 Maret 2013

Abstrak

Sebuah server, yang dapat dikonfigurasi untuk mengelola distribusi konten ke pengguna, dapat menerima informasi terkait konten yang terkait dengan pengguna tertentu dan menganalisis informasi terkait konten. Analisis tersebut dapat terdiri dari membandingkan parameter dalam informasi terkait konten dengan parameter standar terkait di server untuk menentukan aktivitas terkait konten yang dapat diterima dan mengklasifikasikan pengguna berdasarkan analisis informasi terkait konten. Informasi terkait konten dapat terdiri dari satu atau lebih data terkait penggunaan konten, metrik terkait unduhan konten, atau metrik terkait sesi pengguna yang terkait dengan satu atau beberapa sesi yang digunakan oleh pengguna dalam hubungannya dengan penggunaan konten yang dikelola melalui server.

Ini membantu untuk membaca artikel-artikel itu terlebih dahulu sebelum membaca paten ini. Mereka memberikan pengertian tentang apa yang berisiko serta apa yang telah berubah, dan mengapa paten berfokus pada hal-hal yang dilakukannya.

Kami diberitahu bahwa data terkait penggunaan konten adalah metrik penting yang terdiri dari:

  1. Data yang dihasilkan dalam perangkat elektronik selama penggunaan konten oleh pengguna,
  2. Data pasar yang berkaitan dengan jumlah pembelian atau pembaruan konten tertentu, dan
  3. Data pihak ketiga dari aktivitas penggunaan konten.

Paten memberi tahu kami tentang metrik terkait unduhan yang mencakup hal-hal seperti:

  1. Persentase jenis konten tertentu dari semua konten yang diunduh oleh pengguna
  2. Jumlah maksimum konten yang diunduh dalam satu hari
  3. Jumlah total konten yang diunduh
  4. Jumlah maksimum konten yang diunduh dalam satu minggu

Hal lain yang mungkin dilihat oleh toko adalah bagaimana orang yang mencari aplikasi dapat bertindak di App store:

Metrik terkait sesi pengguna dapat mencakup:

  1. Persentase konten yang diunduh dari pencarian oleh pengguna
  2. Sejumlah pertanyaan yang dikeluarkan oleh pengguna
  3. Persentase konten yang diunduh dari penjelajahan dan/atau klik-tayang
  4. Durasi sesi rata-rata dan/atau penundaan dari penelusuran hingga pengunduhan
  5. Persentase konten yang diunduh dari lalu lintas masuk langsung.

Metrik Berbasis Penggunaan Aplikasi untuk Menemukan Spam App Store

Selain melihat bagaimana orang berperilaku di toko aplikasi, perangkat yang menjalankan aplikasi dapat mengumpulkan data tentang bagaimana aplikasi tersebut digunakan oleh orang yang menginstalnya.

Kami diberikan perincian motivasi di balik pendekatan semacam itu dan cara kerjanya, dalam deskripsi paten:

Misalnya, dengan peringkat berbasis penggunaan aplikasi dan/atau deteksi spam, aplikasi dapat diberi peringkat berdasarkan penggunaan alih-alih jumlah total unduhan. Dalam hal ini, penggunaan mungkin jauh lebih mahal untuk dihasilkan daripada mengunduh, dan dengan demikian membuat biaya untuk menghasilkan spam unduhan aplikasi terlalu mahal untuk berkelanjutan. Oleh karena itu, perangkat klien dapat mengumpulkan dan/atau memperoleh metrik terkait penggunaan. Contoh metrik terkait penggunaan dapat terdiri dari metrik terkait sistem operasi (OS) dan/atau informasi terkait API lainnya, seperti beberapa kali aplikasi tertentu dimulai dan berapa lama pengguna menggunakannya; metrik pasar, seperti beberapa kali aplikasi diperbarui dan berapa kali pembelian dalam aplikasi (karena pasar aplikasi menangani pembayaran); dan data pihak ketiga. Dalam hal ini, entitas aplikasi pihak ketiga khusus dapat mengumpulkan dan/atau memperoleh penggunaan aplikasi dari ratusan ribu penggunaan aplikasi di ratusan juta perangkat, dan/atau menyediakan data tersebut. Server manajemen aplikasi awalnya dapat menentukan kelayakan metrik terkait penggunaan. Setelah ditentukan dapat dipercaya, server manajemen aplikasi dapat menggabungkan dan/atau menganalisis semua informasi terkait penggunaan yang berbeda, yang memungkinkan penentuan lebih optimal bagaimana rata-rata pengguna akan menggunakan aplikasi tertentu (misalnya, berapa banyak waktu menggunakan aplikasi), dan dengan demikian manajemen aplikasi server dapat memberi peringkat aplikasi (atau menyesuaikan peringkat yang ada) sesuai dengan itu. Selain itu, server manajemen aplikasi dapat menggunakan peringkat dan/atau penyesuaian peringkat dalam memutuskan klasifikasi pengguna.

Kesimpulan: Mengidentifikasi Kelainan

Paten juga memberikan detail tentang cara mengunduh interaksi dan data sesi pengguna dapat digunakan untuk mengidentifikasi Spammer. Detail ini juga membantu menentukan Aplikasi yang mungkin tidak sah. Ini adalah jenis data pengguna yang mungkin ditinjau saat Aplikasi dipilih dan diunduh:

Server manajemen aplikasi dapat, misalnya, memperoleh, mengumpulkan, atau menerima data yang berkaitan dengan permintaan pencarian pengguna yang dilakukan melalui kotak pencarian pasar;
tautan yang diklik pada halaman pasar;
tampilan pengguna halaman pasar;
waktu yang dihabiskan di setiap halaman;
dan/atau pengguna aplikasi acara unduhan (dibeli) diunduh, diinstal.

Paten memberi tahu kami bahwa informasi juga dikumpulkan saat pengguna melewati fase penemuan dan menemukan aplikasi, dan bahwa mereka mengawasi dengan cermat aktivitas yang tidak biasa:

Untuk setiap aplikasi yang diunduh, server manajemen aplikasi dapat mengidentifikasi alasan mengapa aplikasi diunduh dan dapat menghasilkan serangkaian metrik terkait sesi pengguna yang sesuai dengan unduhan tersebut. Penganalisis data aplikasi kemudian dapat menentukan persentase di seluruh populasi pengguna untuk mengidentifikasi kelainan. Contoh metrik sesi mungkin berkaitan dengan hal-hal seperti beberapa kueri yang dikeluarkan pengguna selama sesi tertentu (dan/atau total kueri dalam periode tertentu–misalnya, per hari); persentase aplikasi yang diunduh dari pencarian; persentase aplikasi yang diunduh dari penelusuran dan klik-tayang; persentase aplikasi yang diunduh dari lalu lintas masuk langsung; durasi sesi rata-rata; dan/atau penundaan dari pencarian untuk mengunduh. Dengan demikian, memperoleh metrik terkait sesi pengguna untuk keseluruhan populasi pengguna dapat memungkinkan untuk menentukan kriteria terkait sesi yang diharapkan yang berlaku (misalnya, ambang batas), yang pada gilirannya akan digunakan (misalnya, perbandingan) dalam menentukan di mana metrik sesi sesuai dengan aplikasi pengguna tertentu jatuh (yaitu, dibandingkan dengan populasi pengguna secara keseluruhan), dan dengan demikian memungkinkan klasifikasi pengguna.

Perilaku tidak biasa yang terkait dengan perilaku orang di App Store dapat membantu menunjukkan Aplikasi yang mungkin bukan Aplikasi yang ingin digunakan atau diunduh orang. Kami melihat kesuksesan yang dimiliki Google dan Apple dengan Game Pokemon yang sangat populer tahun lalu. Memberikan aplikasi populer kepada orang-orang dapat sepadan dengan upaya memerangi Spam App Store.