Come Google trova lo spam nell'App Store

Pubblicato: 2017-11-01

Google sta cercando lo spam dell'app store nel Play Store tra le applicazioni disponibili.

Brevetto Trovare spam nell'App Store

Mi piace guardare i brevetti che coinvolgono la ricerca e il Web è perché spiegano i problemi che i motori di ricerca stanno cercando di risolvere. Questi brevetti ci mostrano invenzioni intese come soluzioni per affrontare questi problemi. A volte ci mostrano come qualcuno potrebbe imparare a risolvere i propri problemi studiando come altre aziende hanno affrontato problemi simili.

Questo mese è stato concesso un brevetto di Google che trova lo spam dell'app store. Con Google che ha inventato ed eseguito il sistema operativo Android, ha sviluppato un mercato per le app in esecuzione su dispositivi Android. Come concorrente di Apple, ha molto da imparare da Apple. Il brevetto di Google cita un paio di articoli citati dai richiedenti il ​​brevetto che potrebbero aver influenzato la loro scrittura. Leggerli è una buona introduzione al brevetto.

È interessante notare che questi articoli si concentrano sull'App Store di Apple, al contrario di uno gestito da Google. È logico che Google esamini anche i problemi che l'App Store di Apple potrebbe aver avuto per aiutarli a gestire il proprio App Store.

Il primo di questi articoli è intitolato Identificazione dello spam nell'app store di iOS

L'estratto di questo documento ci parla di app e problemi relativi alle persone che inviano spam all'App Store di Apple:

Le app popolari sull'App Store di Apple iOS possono generare milioni di dollari di profitti e raccogliere preziose informazioni personali sugli utenti. Le recensioni fraudolente potrebbero indurre gli utenti a scaricare app spam potenzialmente dannose o a ignorare ingiustamente le app vittime dello spam delle recensioni. Pertanto, l'identificazione automatica dello spam nell'App Store è un problema importante. Questo documento mira a introdurre e caratterizzare nuovi set di dati acquisiti tramite la scansione dell'App Store iOS, confrontare un modello di albero decisionale di base con un nuovo modello grafico Latent Class per la classificazione dello spam delle app e analizzare i risultati preliminari per le revisioni dei cluster.

Nell'introduzione al documento, ci viene detto di più sui problemi con le app di spam:

Gli sviluppatori di app di spam (sviluppatori dannosi) sono principalmente interessati a ottenere profitti monetari o a lisciviare dati utente preziosi, come i contatti della rubrica. Le app popolari e apparentemente legittime possono divulgare i dati degli utenti in modo silenzioso [2, 4], quindi è possibile che le app di spam tentino di fare lo stesso.

È possibile imparare molto guardando i problemi che altri hanno sperimentato:

Uno sviluppatore malintenzionato potrebbe pubblicare recensioni di spam utilizzando diversi account utente iTunes usa e getta, ad esempio "sockpuppets". Apple ha tentato di ridurre la frequenza dello spam richiedendo agli utenti di acquistare e scaricare un'app prima di poterla rivedere. Tuttavia, gli account utente di sockpuppet possono ancora essere creati utilizzando le carte regalo iTunes e il potenziale profitto e il furto di dati utente potrebbero giustificare il costo.

Questo documento ci dice che hanno lavorato per identificare lo spam. Lo fanno esaminando i modelli di recensione che coinvolgono il comportamento di spam nell'App Store.

L'altro documento ci parla di altre cose che Apple ha cercato di fare per identificare il comportamento dello spam:

Apple potrebbe aver ottimizzato l'algoritmo di classificazione dell'App Store, rendendo i download meno importanti

È interessante notare che questo documento tratta anche delle app nello store Android:

Google, che modifica costantemente le sue classifiche di Android Market, potrebbe aver iniziato a pesare il rapporto di un'app tra utenti attivi giornalieri e utenti attivi mensili – una misura della viscosità – più pesantemente nelle ultime settimane, secondo il social network incentrato sugli adolescenti MyYearbook. L'azienda aveva notato fluttuazioni sospette di ranking nell'intero portafoglio di app. Google non ha commentato questo.

Ci viene detto che un tempo i download erano molto importanti nell'Apple Store. Questo è un cambiamento significativo:

Le modifiche sono un grosso problema perché le classifiche degli app store di Apple hanno finora fatto affidamento sulla velocità di download di un'app. Questo ha permesso a un'intera industria di fiorire. Reti come Flurry, Tapjoy e W3i consentono agli sviluppatori di pagare per i download, che portano le loro app in cima alle classifiche dove possono ottenere ancora più download avendo visibilità extra. Se sono buoni, restano in cima alle classifiche. Se sono cattivi, cadono rapidamente.

Il brevetto di Google è:

Rilevamento dello spam sul ranking dell'archivio applicazioni
Inventori: Kaihua Zhu e Ping Wu
Assegnatario: GOOGLE INC.
Brevetto USA: 9.794.106
Concesso: 17 ottobre 2017
Archiviato: 4 marzo 2013

Astratto

Un server, che può essere configurato per gestire la distribuzione del contenuto agli utenti, può ricevere informazioni relative al contenuto associate a un particolare utente e analizzare le informazioni relative al contenuto. Tale analisi può comprendere il confronto di parametri nelle informazioni relative al contenuto con corrispondenti parametri predefiniti nel server per determinare attività accettabili relative al contenuto e classificare utenti in base all'analisi delle informazioni relative al contenuto. Le informazioni relative ai contenuti possono comprendere uno o più dati relativi all'utilizzo dei contenuti, metriche relative al download di contenuti o metriche relative alla sessione utente relative a una o più sessioni utilizzate dagli utenti in concomitanza con l'utilizzo dei contenuti gestiti tramite il server.

È utile leggere quegli articoli prima di leggere questo brevetto. Forniscono un'idea di ciò che è a rischio e di ciò che è cambiato e del motivo per cui il brevetto si concentra sulle cose che fa.

Ci viene detto che i dati relativi all'utilizzo dei contenuti sono metriche importanti costituite da:

  1. Dati generati in dispositivi elettronici durante l'utilizzo dei contenuti da parte dell'utente,
  2. Dati di mercato relativi al numero di acquisti o aggiornamenti di particolari contenuti, e
  3. Dati di terze parti sulle attività di utilizzo dei contenuti.

Il brevetto ci parla di metriche relative al download che includono cose come:

  1. Una percentuale di un particolare tipo di contenuto da tutti i contenuti scaricati dall'utente
  2. Un numero massimo di contenuti scaricati in un solo giorno
  3. Un numero totale di contenuti scaricati
  4. Un numero massimo di contenuti scaricati in una sola settimana

Un'altra cosa che un negozio potrebbe guardare è come le persone che cercano app potrebbero agire in un App Store:

Le metriche relative alla sessione utente potrebbero includere:

  1. Una percentuale del contenuto scaricato dalla ricerca dall'utente
  2. Una serie di query emesse dall'utente
  3. Una percentuale del contenuto scaricato dalla navigazione e/o dal clic
  4. Una durata media della sessione e/o un ritardo dalla ricerca al download
  5. Una percentuale di contenuti scaricati dal traffico in entrata diretto.

Metriche basate sull'utilizzo delle applicazioni per trovare lo spam dell'App Store

Oltre a esaminare il comportamento delle persone in un app store, i dispositivi che eseguono app possono raccogliere dati su come tali app vengono utilizzate dalle persone che le installano.

Ci vengono forniti dettagli sulle motivazioni alla base di un tale approccio e su come funziona, nella descrizione del brevetto:

Ad esempio, con la classificazione basata sull'utilizzo dell'applicazione e/o il rilevamento dello spam, le applicazioni possono essere classificate in base all'utilizzo anziché al numero totale di download. A questo proposito, l'utilizzo può essere molto più costoso da generare rispetto al download, rendendo così il costo della generazione di spam da download di applicazioni troppo elevato per essere sostenibile. Di conseguenza, i dispositivi client possono raccogliere e/o ottenere metriche relative all'utilizzo. Esempi di metriche relative all'utilizzo possono comprendere metriche relative al sistema operativo (SO) e/o altre informazioni relative all'API, come diverse volte che una particolare applicazione viene avviata e per quanto tempo gli utenti la utilizzano; metriche di mercato, come il numero di aggiornamenti dell'applicazione e il numero di acquisti interni all'applicazione (mentre i mercati delle applicazioni gestiscono il pagamento); e dati di terzi. A questo proposito, entità applicative di terze parti specializzate possono raccogliere e/o ottenere l'utilizzo dell'applicazione di centinaia di migliaia di applicazioni su centinaia di milioni di dispositivi e/o fornire tali dati. Il server di gestione delle applicazioni può inizialmente determinare l'affidabilità delle metriche relative all'utilizzo. Una volta determinato l'affidabilità, il server di gestione dell'applicazione può combinare e/o analizzare tutte le diverse informazioni relative all'utilizzo, il che consente di determinare in modo più ottimale come un utente medio utilizzerebbe una particolare applicazione (ad esempio, quanto tempo utilizza l'applicazione), e quindi la gestione dell'applicazione il server può classificare le applicazioni (o modificare qualsiasi classificazione esistente) di conseguenza. Inoltre, il server di gestione delle applicazioni può utilizzare la classificazione e/o l'adeguamento alla classificazione per decidere in merito alla classificazione degli utenti.

Conclusione: identificare le anomalie

Il brevetto fornisce anche dettagli su come scaricare l'interazione e i dati della sessione utente possono essere utilizzati per identificare gli Spammer. Questi dettagli aiutano anche a determinare le app che potrebbero non essere legittime. Questo è il tipo di dati utente che potrebbero essere esaminati quando un'app viene selezionata e scaricata:

Il server di gestione dell'applicazione può, ad esempio, ottenere, raccogliere o ricevere dati relativi alle query di ricerca degli utenti effettuate tramite la casella di ricerca di mercato;
link cliccati sulle pagine del mercato;
visualizzazioni degli utenti della pagina di mercato;
tempo trascorso su ogni pagina;
e/o l'utente dell'applicazione dell'evento di download (acquistato) scaricato, installato.

Il brevetto ci dice che le informazioni vengono raccolte anche quando gli utenti attraversano una fase di scoperta e trovano un'applicazione e che stanno osservando attentamente l'attività insolita:

Per ogni applicazione scaricata, il server di gestione dell'applicazione può identificare il motivo per cui l'applicazione viene scaricata e può generare una serie di metriche relative alla sessione utente corrispondenti a quel download. L'analizzatore dei dati dell'applicazione può quindi determinare la percentuale nella popolazione complessiva degli utenti per identificare un'anomalia. L'esempio di metriche di sessione può riguardare cose come diverse query emesse dall'utente durante una particolare sessione (e/o query totali in un particolare periodo, ad esempio al giorno); la percentuale di applicazioni scaricate dalla ricerca; percentuale di applicazioni scaricate da navigazione e clickthrough; percentuale di applicazioni scaricate dal traffico diretto in entrata; durata media della sessione; e/o ritardo dalla ricerca al download. Di conseguenza, l'ottenimento di metriche relative alla sessione utente per la popolazione complessiva degli utenti può consentire di determinare i criteri applicabili relativi alla sessione prevista (ad es. soglia/e), che a loro volta verrebbero utilizzati (ad es. confronto) per determinare dove le metriche di sessione corrispondenti a la/le applicazione/i di un utente particolare cadono (cioè, rispetto alla popolazione complessiva degli utenti), e quindi consentono la classificazione dell'utente.

Un comportamento insolito relativo al comportamento delle persone in un App Store può aiutare a evidenziare le app che potrebbero non essere app che le persone vorrebbero utilizzare o scaricare. Abbiamo visto il successo che sia Google che Apple hanno avuto con il popolarissimo Pokemon Game lo scorso anno. Fornire alle persone un'app popolare può valere la pena di combattere lo spam dell'App Store.