Cum găsește Google Spam în App Store

Publicat: 2017-11-01

Google caută spam din magazinul de aplicații în magazinul Play printre aplicațiile disponibile acolo.

Brevetarea Găsirea spamului din App Store

Îmi place să mă uit la brevete care implică căutare, iar Web-ul este pentru că ele explică problemele pe care motoarele de căutare încearcă să le rezolve. Aceste brevete ne arată invenții menite ca soluții pentru a rezolva aceste probleme. Uneori, ei ne arată cum cineva ar putea învăța să-și rezolve problemele, studiind modul în care alte companii au abordat probleme similare.

Luna aceasta, a fost acordat un brevet Google care găsește spam în magazinul de aplicații. Odată cu inventarea și rularea sistemului de operare Android, Google a dezvoltat o piață pentru aplicații care rulează pe dispozitive Android. În calitate de concurent al Apple, are multe de învățat de la Apple. Brevetul Google menționează câteva articole citate de solicitanții de brevet care le-au influențat eventual scrierea. Citirea acestora este o bună introducere în brevet.

Interesant este că acele articole se concentrează pe magazinul de aplicații Apple, spre deosebire de unul condus de Google. Este logic ca Google să se uite și la problemele pe care le-ar fi putut avea Apple App Store pentru a-i ajuta să-și conducă propriul App Store.

Primul dintre aceste articole este unul numit, Identificarea spamului în magazinul de aplicații iOS

Rezumatul din această lucrare ne spune despre aplicații și probleme legate de persoanele care trimit spam în Apple App Store:

Aplicațiile populare din Apple iOS App Store pot genera profituri de milioane de dolari și pot colecta informații personale valoroase despre utilizatori. Recenziile frauduloase ar putea înșela utilizatorii să descarce aplicații de spam potențial dăunătoare sau să ignore pe nedrept aplicațiile care sunt victime ale spamului de recenzii. Astfel, identificarea automată a spam-ului în App Store este o problemă importantă. Această lucrare își propune să introducă și să caracterizeze seturi de date noi obținute prin accesarea cu crawlere a iOS App Store, să compare un model de bază de arbore de decizie cu un model grafic nou pentru clasificarea spam-ului aplicațiilor și să analizeze rezultatele preliminare pentru revizuirile grupării.

În introducerea lucrării, ni se spune mai multe despre problemele cu aplicațiile de spam:

Dezvoltatorii de aplicații de spam (dezvoltatori rău intenționați) sunt interesați în primul rând de obținerea de profit monetar sau de leșierea datelor valoroase ale utilizatorilor, cum ar fi contactele din agendă. Aplicațiile populare, aparent legitime, pot scurge datele utilizatorilor în liniște [2, 4], așa că este posibil ca aplicațiile de spam să încerce să facă același lucru.

Este posibil să înveți multe analizând problemele pe care le-au experimentat alții:

Un dezvoltator rău intenționat ar putea posta recenzii de spam folosind mai multe conturi de utilizator iTunes, de exemplu „sockpuppets”. Apple a încercat să scadă frecvența spam-ului solicitând utilizatorilor să cumpere și să descarce o aplicație înainte de a o putea revizui. Cu toate acestea, conturile de utilizator sockpuppet pot fi create în continuare folosind carduri cadou iTunes, iar potențialul de profit și datele utilizatorilor furate ar putea justifica costul.

Această lucrare ne spune că au lucrat pentru a identifica spam-ul. Ei fac acest lucru uitându-se la modelele de revizuire care implică comportamentul spam în App Store.

Cealaltă lucrare ne spune despre alte lucruri pe care Apple a încercat să le facă pentru a identifica comportamentul spam:

Apple ar putea să fi modificat algoritmul de clasare al App Store, făcând descărcările mai puțin importante

Interesant, această lucrare discută și despre aplicațiile din magazinul Android:

Google, care își modifică constant clasamentul pe Android Market, este posibil să fi început să cântărească raportul dintre utilizatorii activi zilnici și utilizatorii activi lunari – o măsură a caracterului persistent – ​​mai mult în ultimele săptămâni, potrivit rețelei de socializare MyYearbook, axată pe adolescenți. Compania a observat fluctuații suspecte de clasare în întregul său portofoliu de aplicații. Google nu a comentat acest lucru.

Ni se spune că la un moment dat, descărcările erau foarte importante în Apple Store. Aceasta este o schimbare semnificativă:

Schimbările sunt o mare problemă, deoarece clasamentele magazinului de aplicații Apple s-au bazat până în prezent în mare măsură pe rata de descărcare a unei aplicații. Acest lucru a permis o întreagă industrie de cabană să înflorească. Rețele precum Flurry, Tapjoy și W3i permit dezvoltatorilor să plătească pentru descărcări, ceea ce își plasează aplicațiile în partea de sus a topurilor, unde pot obține și mai multe descărcări având o vizibilitate suplimentară. Dacă sunt bune, rămân în fruntea topurilor. Dacă sunt rele, cad repede.

Brevetul Google este:

Detectarea spam-ului în clasamentul magazinului de aplicații
Inventatori: Kaihua Zhu și Ping Wu
Cesionar: GOOGLE INC.
Brevet SUA: 9.794.106
Acordat: 17 octombrie 2017
Depus: 4 martie 2013

Abstract

Un server, care poate fi configurat pentru a gestiona distribuția de conținut către utilizatori, poate primi informații legate de conținut asociate cu un anumit utilizator și poate analiza informațiile legate de conținut. O astfel de analiză poate cuprinde compararea parametrilor din informațiile legate de conținut cu parametrii predefiniți corespunzători din server pentru a determina activitățile acceptabile legate de conținut și clasificarea utilizatorilor pe baza analizei informațiilor legate de conținut. Informațiile legate de conținut pot cuprinde una sau mai multe date legate de utilizarea conținutului, valori legate de descărcarea conținutului sau valori legate de sesiunea utilizatorului referitoare la una sau mai multe sesiuni utilizate de utilizatori împreună cu utilizarea conținutului gestionat prin intermediul serverului.

Este de ajutor să citiți mai întâi acele articole înainte de a citi acest brevet. Ele oferă o idee a ceea ce este în pericol, precum și a ceea ce s-a schimbat și de ce brevetul se concentrează pe lucrurile pe care le face.

Ni se spune că datele legate de utilizarea conținutului sunt valori importante care sunt alcătuite din:

  1. Date generate în dispozitivele electronice în timpul utilizării conținutului de către utilizator,
  2. Date de piață referitoare la numărul de achiziții sau actualizări ale unui anumit conținut și
  3. Date ale terților privind activitățile de utilizare a conținutului.

Brevetul ne spune despre valorile legate de descărcare care includ lucruri precum:

  1. Un procent dintr-un anumit tip de conținut din tot conținutul descărcat de utilizator
  2. Un număr maxim de conținut descărcat într-o singură zi
  3. Un număr total de conținut descărcat
  4. Un număr maxim de conținut descărcat într-o singură săptămână

Un alt lucru pe care l-ar putea analiza un magazin este modul în care oamenii care caută aplicații ar putea acționa într-un magazin de aplicații:

Valorile legate de sesiunea utilizatorului pot include:

  1. Un procent din conținut descărcat din căutare de către utilizator
  2. O serie de interogări emise de utilizator
  3. Un procent din conținut descărcat din navigare și/sau clic
  4. O durată medie a sesiunii și/sau o întârziere de la căutare până la descărcare
  5. Un procent din conținut descărcat din traficul direct de intrare.

Valori bazate pe utilizarea aplicației pentru a găsi spam în App Store

Pe lângă faptul că se uită la modul în care oamenii se comportă într-un magazin de aplicații, dispozitivele care rulează aplicații pot colecta date despre modul în care aceste aplicații sunt utilizate de persoanele care le instalează.

Ni se oferă detalii despre motivațiile din spatele unei astfel de abordări și despre modul în care funcționează, în descrierea brevetului:

De exemplu, cu clasificarea bazată pe utilizarea aplicațiilor și/sau detectarea spam-ului, aplicațiile pot fi clasificate în funcție de utilizare în loc de numărul total de descărcare. În acest sens, utilizarea poate fi mult mai costisitoare de generat decât descărcare și, astfel, costul generării de spam de descărcare a aplicației este prea costisitor pentru a fi sustenabil. În consecință, dispozitivele client pot colecta și/sau obține valori legate de utilizare. Exemplele de valori legate de utilizare pot include valori legate de sistemul de operare (OS) și/sau alte informații legate de API, cum ar fi de mai multe ori pornește o anumită aplicație și cât timp o folosesc utilizatorii; valorile pieței, cum ar fi de mai multe ori aplicația este actualizată și de câte ori achizițiile în aplicație (pe măsură ce piețele de aplicații gestionează plata); și datele terților. În acest sens, entitățile specializate de aplicații terțe pot colecta și/sau obține utilizarea aplicației de sute de mii de utilizare a aplicațiilor pe sute de milioane de dispozitive și/sau furniza acele date. Serverul de gestionare a aplicațiilor poate determina inițial fiabilitatea valorilor legate de utilizare. Odată stabilit că este demn de încredere, serverul de gestionare a aplicațiilor poate combina și/sau analiza toate informațiile diferite legate de utilizare, ceea ce permite determinarea mai optimă a modului în care un utilizator mediu ar folosi o anumită aplicație (de exemplu, cât timp folosește aplicația) și, astfel, gestionarea aplicației serverul poate clasifica aplicațiile (sau poate ajusta orice clasare existentă) în consecință. De asemenea, serverul de gestionare a aplicației poate utiliza clasarea și/sau ajustarea la clasament pentru a decide cu privire la clasificarea utilizatorilor.

Concluzie: Identificarea anomaliilor

Brevetul oferă, de asemenea, detalii despre cum să descărcați interacțiunea și datele despre sesiunile utilizatorului pot fi folosite pentru a identifica spammerii. Aceste detalii ajută și la determinarea aplicațiilor care ar putea să nu fie legitime. Acesta este tipul de date despre utilizator care ar putea fi examinate atunci când o aplicație este selectată și descărcată:

Serverul de gestionare a aplicațiilor poate, de exemplu, să obțină, să colecteze sau să primească date referitoare la interogările de căutare ale utilizatorilor efectuate prin caseta de căutare a pieței;
link-uri pe care s-a făcut clic pe paginile pieței;
vizualizări ale utilizatorilor paginii de piață;
timpul petrecut pe fiecare pagină;
și/sau utilizatorul aplicației de descărcare a evenimentului (cumpărat) descărcat, instalat.

Brevetul ne spune că informațiile sunt colectate și atunci când utilizatorii trec printr-o fază de descoperire și găsesc o aplicație și că urmăresc cu atenție activități neobișnuite:

Pentru fiecare aplicație descărcată, serverul de gestionare a aplicației poate identifica motivul pentru care aplicația este descărcată și poate genera un set de valori legate de sesiunea utilizatorului, corespunzătoare descărcării respective. Analizorul de date aplicației poate determina apoi procentul din populația totală de utilizatori pentru a identifica o anomalie. Exemple de valori ale sesiunii pot fi legate de lucruri precum mai multe interogări pe care utilizatorul le-a emis în timpul unei anumite sesiuni (și/sau interogare totală în perioada respectivă – de exemplu, pe zi); procentul de aplicație descărcată din căutare; procentul aplicației descărcate din navigare și clic; procentul aplicației descărcate din traficul direct de intrare; durata medie a sesiunii; și/sau întârziere de la căutare la descărcare. În consecință, obținerea de valori legate de sesiunea utilizatorului pentru populația totală de utilizatori poate permite determinarea criteriilor de sesiune așteptate aplicabile (de exemplu, prag(e)), care, la rândul lor, ar fi utilizate (de exemplu, comparație) pentru a determina unde valorile de sesiune corespund cu aplicația (aplicațiile) unui anumit utilizator scade (adică, în comparație cu populația totală de utilizatori), și astfel permit clasificarea utilizatorului.

Comportamentul neobișnuit legat de modul în care oamenii se comportă într-un App Store poate ajuta la evidențierea aplicațiilor care ar putea să nu fie aplicații pe care oamenii ar dori să le folosească sau să le descarce. Am văzut succesul pe care atât Google, cât și Apple l-au avut cu foarte popularul Joc Pokemon anul trecut. Oferirea oamenilor cu o aplicație populară poate merita efortul de a lupta împotriva spamului din App Store.