Un brevetto Panda sul sito Web e sulla durata della visita della categoria
Pubblicato: 2017-07-28
Un paio di mesi fa, a giugno, ho scritto il post, Click a Panda: risultati di ricerca di alta qualità basati su clic ripetuti e durata della visita.
In quel post, ho sottolineato che l'ingegnere di ricerca di Google Navneet Panda, da cui prende il nome l'aggiornamento Panda di Google, aveva lavorato su alcuni brevetti incentrati su risultati di ricerca di alta qualità. E che non ho potuto fare a meno di rivedere i nuovi brevetti che potrebbero essere stati scritti da Panda dopo l'aggiornamento di Panda. Il brevetto di cui ho scritto a giugno era un brevetto di continuazione che aggiungeva informazioni sui clic ripetuti sui risultati di ricerca e misurava la durata delle visite a quelle pagine. I clic ripetuti e la misurazione della durata delle visite ai siti sono stati abbastanza interessanti da farmi chiedere se potrei trovare qualcosa che valga ugualmente la pena di indagare
Aveva guardato segnali simili su altri siti web?
Punteggio delle prestazioni della durata del sito web
Un brevetto del 6 dicembre 2016 di Navneet Panda e James A. Kunz, intitolato Prestazioni della durata del sito Web in base alla durata delle categorie, esamina la durata del sito Web e i clic sulle sezioni dei siti. La descrizione del brevetto fornisce un riepilogo di come funziona questo brevetto. La prima parte sembra abbastanza semplice:
L'indice, i log delle query e i log di navigazione vengono elaborati per generare i dati del sito. I dati del sito descrivono i siti Web e includono i dati che caratterizzano le visite a particolari risorse dei siti Web da parte degli utenti e la durata di ciascuna di tali visite. Ad esempio, i dati sulle visite possono identificare i clic degli utenti sui risultati di ricerca inclusi nelle pagine Web dei risultati di ricerca o gli input diretti di URL e, per ciascuna delle selezioni e degli input, una misurazione della durata del tempo trascorso tra il tempo in cui il l'utente ha richiesto la risorsa e l'ora in cui il dispositivo dell'utente ha richiesto un'altra risorsa.
Il brevetto usa la parola "durata" per parlare del tempo che potrebbe essere necessario per visitare una pagina:
I dati ottenuti caratterizzano le visite degli utenti alle risorse e la durata di tali visite. In questi dati, la durata di una visita può essere misurata in diversi modi. Ad esempio, la durata di una visita può essere misurata come il tempo che intercorre tra il momento in cui un utente avvia una richiesta per una risorsa, ad esempio, facendo clic su un collegamento alla risorsa o inserendo un localizzatore di risorse per la risorsa in un campo di input fornito da un programma applicativo in esecuzione sul dispositivo dell'utente o da un componente aggiuntivo del programma applicativo e l'ora in cui l'utente avvia un'altra richiesta per un'altra risorsa. In alternativa, la durata può essere misurata come, ad esempio, il tempo tra il tempo in cui una risorsa è completamente resa dal programma applicativo e il tempo in cui l'utente avvia un'altra richiesta per un'altra risorsa.
Il brevetto esamina anche i pesi delle categorie o degli argomenti che possono essere associati a una risorsa:
Un processo esterno al motore di ricerca può classificare le risorse ei siti web. In alcune implementazioni, le risorse vengono classificate individualmente e i siti Web vengono quindi classificati in base alle categorie di risorse. Ogni risorsa e sito web può anche appartenere a più di una categoria e ogni categorizzazione può essere riflessa da un peso di categoria che è una misura della forza dell'associazione della categoria alla risorsa e/o al sito web. Ad esempio, una risorsa che include una notizia su un atleta professionista che lancia una catena di ristoranti può avere pesi di categoria che riflettono rispettivamente una rilevanza moderata per le categorie di notizie, sport e ristorazione. Al contrario, una risorsa che include una notizia relativa a un conflitto internazionale può avere un peso di categoria che riflette una rilevanza molto elevata per la categoria delle notizie internazionali.
Il brevetto parla di misurare la durata delle sessioni e di pesare le durate in base a diverse categorie su un sito. Ci viene detto quanto segue, quali sono gli usi interessanti dei punteggi di durata:
I punteggi delle prestazioni di durata possono essere utilizzati per assegnare punteggi a risorse e siti Web per le operazioni di ricerca. Le operazioni di ricerca possono includere l'assegnazione di punteggi alle risorse per i risultati di ricerca, la priorità dell'indicizzazione dei siti Web, il suggerimento di risorse o siti Web, la protezione di particolari risorse o siti Web da retrocessioni, l'esclusione di particolari risorse o siti Web dalle promozioni o altre operazioni di ricerca appropriate.
Le informazioni sulla durata raccolte sulle visite alle diverse parti di un sito possono essere utilizzate per dire a un motore di ricerca di più su quel sito. Ci viene detto di un punteggio delle prestazioni di durata del sito Web basato sui punteggi di durata della categoria:

Il processo determina, per ciascuna della pluralità di categorie a cui appartiene il sito Web, un punteggio di durata di categoria basato sulle misurazioni di durata, ogni punteggio di durata di categoria essendo proporzionale alle durate di tempo dalle misurazioni di durata (206). In alcune implementazioni, per determinare i punteggi di durata della categoria, viene determinato un singolo punteggio di durata del sito Web per un sito Web, quindi il punteggio di durata viene utilizzato per generare i punteggi di durata della categoria per il sito Web. Da questi punteggi di durata di categoria, viene determinato il punteggio di prestazione di durata per il sito web.
Il processo determina, da uno o più punteggi di durata della categoria, un punteggio di prestazione di durata per il sito web (208). Il punteggio delle prestazioni di durata è, in alcune implementazioni, proporzionale a uno o più punteggi di durata della categoria da cui viene determinato il punteggio delle prestazioni di durata (208). Ad esempio, il punteggio delle prestazioni di durata può essere basato su tutti i punteggi di durata della categoria per il sito web. In alternativa, il punteggio delle prestazioni di durata può essere basato su un sottoinsieme appropriato dei punteggi di durata della categoria per il sito web.
Riduzione del rumore
Uno dei problemi che viene spesso menzionato da qualcuno di Google sull'uso dei dati sul comportamento degli utenti nelle classifiche è che spesso è un segnale rumoroso. Questo brevetto parla di come potrebbe funzionare per ridurre il rumore in tali segnali. È interessante vedere una discussione del genere. (non sono sicuro di aver mai visto un elenco come questo da Google sulla riduzione dei segnali rumorosi.) Ecco alcuni modi in cui il rumore potrebbe essere ridotto:
Filtraggio dei clic brevi e riduzione di altri fattori di rumore : in alcune implementazioni, il tempo di durata dell'ultima visita viene scontato quando si determina un tempo di durata per una sessione. Il tempo di durata dell'ultima visita corrisponde alla misurazione della durata generata in risposta a un dispositivo dell'utente che richiede una risorsa dal sito Web e richiede una risorsa da un altro sito Web diverso. Lo sconto viene effettuato, ad esempio, per filtrare i "clic brevi", quando viene selezionato un risultato di ricerca e quindi l'utente torna a una pagina dei risultati di ricerca o quando una singola visita a un sito Web viene prolungata a causa di ritardi nel caricamento della pagina. Un altro motivo per scontare il tempo di durata dell'ultima visita è che i tempi di durata dell'ultima visita possono essere soggetti a 2) altri fattori di rumore, come un utente che lascia un computer con una risorsa visualizzata, e poi torna un'ora dopo e naviga immediatamente verso un'altra risorsa di un altro sito web. Ad esempio, scontando il tempo di durata dell'ultima visita dalla Tabella 1 sopra, viene calcolato un tempo di durata di 525 secondi.
Rimozione della durata della visita precedente : in alcune implementazioni, viene aggiunta una durata della visita precedente quando si determina una durata per una sessione. Il tempo di durata della precedente visita corrisponde alla misurazione della durata generata sull'ultima risorsa visitata nel primo sito Web immediatamente prima di selezionare la prima risorsa su un secondo sito Web. Ad esempio, nella tabella 1 sopra, la misurazione della durata per la risorsa R0 sui siti Web S0 è di 160 secondi. Questa è una durata della visita precedente per le durate delle risorse R1-R7. Pertanto, scontando il tempo di durata dell'ultima visita dalla Tabella 1 sopra e tenendo conto della durata della visita precedente, viene calcolato un tempo di durata di 685 secondi.
Indirizzamento Potenziamento dalle visite precedenti : in alcune implementazioni, viene potenziata ogni misurazione della durata generata in risposta a un dispositivo utente che richiede una risorsa in risposta all'input diretto dell'utente di un indirizzo della risorsa. Tale input diretto è indicativo di una valutazione positiva della qualità da parte dell'utente, e quindi il tempo di durata per quella risorsa è aumentato. Il valore di boost può essere un valore fisso oppure può essere proporzionale alla frequenza o quantità con cui l'indirizzo viene inserito direttamente dagli utenti. Ad esempio, supponiamo che il fattore di incremento sia 1,5 e supponiamo che venga utilizzato anche lo sconto dell'ultima durata dell'ultima visita. Dalla tabella 1 sopra, se la prima risorsa viene richiesta in risposta all'input diretto dell'utente, viene calcolato un tempo di durata del sito Web di 585 secondi.
Asporto
È interessante vedere un brevetto di Google che esamina i dati sul comportamento degli utenti, ad esempio ciò su cui qualcuno potrebbe fare clic su un sito e quanto tempo potrebbe trascorrere su quel sito. È anche interessante vedere una discussione di Google su come ridurre il rumore dei segnali di comportamento degli utenti. Quando l'autore di una discussione del genere si chiama Panda, vale la pena rivisitarlo.
