Brevet pentru rezultatele căutării sigure Google și reclasificare sau eliminarea rezultatelor

Publicat: 2018-10-11

Cum utilizează Google un filtru pentru rezultatele căutării sigure pentru a gestiona rezultatele căutării inadecvate, sensibile sau ofensatoare?

Una dintre problemele pe care le pot avea utilizatorii cu internetul este să fie surprinși de conținut pe care nu se așteaptă să-l vadă sau nu sunt dispuși să-l expună și pe alții. Un brevet recent acordat de Google ne vorbește despre eforturile motoarele de căutare de a proteja utilizatorii de un astfel de conținut. Așa cum o formulează în acel brevet:

Utilizatorii de internet pot căuta diverse tipuri de conținut folosind motoarele de căutare. Conținutul de pe internet poate include conținut sensibil sau ofensator, cum ar fi, de exemplu, pornografie, imagini sângeroase și conținut violent. În unele cazuri, utilizatorii pot fi expuși involuntar la conținut sensibil sau ofensator neadecvat. În consecință, ar putea fi de dorit să se limiteze expunerea la conținutul sensibil sau ofensator inadecvat disponibil pe Internet.

Brevetul se referă la Rezultatele Căutării sigure de mai multe ori și îmi amintesc că am auzit despre Matt Cutts de la Google, fiind responsabil pentru ca Google să afișeze Rezultatele Căutării sigure înainte de a deveni șeful de spam al Google. M-am întrebat dacă există un brevet pentru rezultatele căutării sigure sau dacă ar fi avut vreo legătură cu asta, dar nu văzusem unul. Acesta menționează Rezultatele Căutării sigure de destule ori încât probabil că o să mă gândesc la el ca fiind brevetul pentru Rezultatele Căutării sigure de la Google.

Scopul din spatele patentului Google Safe Search Results este de a proteja utilizatorii care folosesc motorul de căutare Google de a fi expuși la conținut pe care s-ar putea să nu-și dorească să-l vadă:

Această dezvăluire descrie în general o metodă și un sistem de aplicare a clasificatorilor la interogările de căutare și la rezultatele căutării pentru a oferi o experiență de căutare în care utilizatorii sunt protejați de expunerea la conținut neadecvat ofensator sau sensibil.

Exact cum funcționează astfel de clasificatoare sigure pentru rezultatele căutării?

1) Ca răspuns la o interogare, un motor de căutare va returna un set preliminar de SERP-uri.
2) Interogarea este clasificată de un clasificator pentru a determina dacă include unul sau mai mulți termeni asociați cu o clasă protejată de persoane sau termeni asociați cu conținut sensibil sau ofensator, cum ar fi conținutul pornografic sau violent.
3) Rezultatele preliminare sunt, de asemenea, clasificate pentru a determina dacă acestea conţin conţinut sensibil sau ofensator
4) Rezultatele căutării sunt returnate celui care caută, astfel încât conținutul sensibil sau ofensator neadecvat să nu fie afișat celui care caută.

Cel care caută primește o indicație că interogarea de căutare este clasificată pentru a include termeni de interogare care

(i) nu se referă probabil la o anumită clasă de persoane,
(ii) probabil legate de o anumită clasă de persoane sau
(iii) se referă probabil la o anumită clasă de persoane și includ termeni sensibili sau ofensatori.

De asemenea, li se va spune că rezultatul căutării este clasificat ca fiind probabil inclusiv

(i) conținut nesensibil și neofensiv sau
(ii) conținut sensibil sau ofensator.

Din setul candidat de rezultate ale căutării, este selectat un set de prezentare a rezultatelor căutării sigure care va apărea cel puțin
(I) indicația că interogarea de căutare este clasificată ca incluzând termeni de interogare care

(i) nu sunt probabil legate de o anumită clasă de persoane,
(ii) sunt probabil legate de o anumită clasă de persoane sau
(iii) sunt probabil legate de o anumită clasă de persoane și includ termeni sensibili sau ofensatori și

(II) indicația că rezultatul căutării este clasificat ca probabil, inclusiv:

(i) conținut nesensibil și neofensiv sau
(ii) conținut sensibil sau ofensator. Unul sau mai multe rezultate de căutare ale setului de prezentare de rezultate ale căutării sunt furnizate pentru ieșire ca răspuns la interogarea de căutare.

Pentru unele dintre aceste rezultate, există o anumită clasă de persoane afectate care include un grup de persoane având cel puțin o caracteristică demografică în comun.

Și, în unele rezultate, termenii sensibili sau ofensatori pot include termeni asociați cu unul sau mai mulți dintre pornografie, violență, gore și falsificare. Conținutul sensibil sau jignitor include imagini, videoclipuri sau date asociate cu una sau mai multe dintre pornografie, violență, sângerări și falsificare.

În unele cazuri, selecția setului de prezentare a rezultatelor căutării sigure din setul candidat de rezultate de căutare include una sau mai multe dintre următoarele acțiuni:

În unele cazuri, o clasare a unui rezultat de căutare în setul candidat de rezultate de căutare este redusă pe baza

(i) indicația că interogarea de căutare utilizată pentru a obține rezultatul căutării este clasificată ca fiind probabil legată de o anumită categorie de persoane și
(ii) indicația că rezultatul căutării este clasificat ca probabil, incluzând conținut sensibil sau jignitor.

În unele cazuri, un rezultat al căutării din setul candidat de rezultate ale căutării poate fi filtrat pentru a elimina rezultatul căutării din setul de prezentare al rezultatelor căutării pe baza

(i) indicația că interogarea de căutare utilizată pentru a obține rezultatul căutării este clasificată ca fiind probabil legată de o anumită categorie de persoane și include termeni sensibili sau ofensatori și
(ii) indicația că rezultatul căutării este clasificat ca probabil, incluzând conținut sensibil sau jignitor.

În unele cazuri, un rezultat al căutării din setul candidat de rezultate sigure ale căutării poate fi selectat pentru a fi inclus în setul de prezentare al rezultatelor căutării fără a modifica o clasare a rezultatului căutării sau a filtra rezultatul căutării pe baza indicației că interogarea de căutare utilizată pentru a obține rezultatul căutării este clasificat ca fiind puțin probabil legat de o anumită clasă de persoane și ca fiind probabil incluzând termeni nesensibili și neofensivi.

În unele cazuri, selecția setului de prezentare a rezultatelor căutării dintre setul candidat de rezultate de căutare include una sau mai multe dintre următoarele acțiuni:

(1) În unele cazuri, un rezultat al căutării din setul candidat de rezultate ale căutării poate fi selectat pentru a fi inclus în setul de prezentare al rezultatelor căutării fără a modifica o clasare a rezultatului căutării sau a filtra rezultatul căutării pe baza indicației că căutarea interogarea utilizată pentru a obține rezultatul căutării este clasificată ca fiind puțin probabil legată de o anumită clasă de persoane și ca fiind probabil incluzând termeni sensibili sau ofensatori.

(2) În unele cazuri, un rezultat al căutării din setul candidat de rezultate de căutare poate fi filtrat pentru a elimina rezultatul căutării din setul de prezentare al rezultatelor căutării, pe baza indicației că interogarea de căutare utilizată pentru a obține rezultatul căutării este clasificată ca probabilă legate de o anumită clasă de persoane și, pe cât posibil, includ termeni sensibili sau ofensatori.

(3) În unele cazuri, acțiunile metodei implementate pe calculator pot include și generarea unui scor de relevanță pentru un document corespunzător fiecărui rezultat al căutării din setul candidat de rezultate de căutare, determinarea unui clasament pentru fiecare rezultat al căutării din setul candidat de rezultatele căutării și primirea datelor despre sesiunea utilizatorului care includ unul sau mai multe atribute ale unui dispozitiv utilizator.

Scorul de relevanță indică relevanța documentului pentru interogarea de căutare. Selecția setului de prezentare a rezultatelor căutării dintre setul candidat de rezultate de căutare include în plus modificarea clasărilor unuia sau mai multor rezultate de căutare în setul candidat de rezultate de căutare pe baza datelor sesiunii utilizator care include unul sau mai multe atribute ale dispozitivului utilizatorului .

În unele cazuri, selecția setului de prezentare a rezultatelor căutării dintre setul candidat de rezultate de căutare poate include, pentru fiecare document corespunzător unui rezultat al căutării, atribuirea unei etichete documentului pe baza cel puțin pe indicația că rezultatul căutării este clasificat ca incluzând conținut sensibil sau ofensator și determinând filtrarea rezultatului căutării sau modificarea clasamentului rezultatului căutării pe baza etichetei atribuite. Eticheta este indicativă pentru subiectul inclus în document.

Brevetul în care se pot face toate aceste filtrări sau incluziuni este descris în:

Protejarea utilizatorilor de rezultate neadecvate sensibile sau jignitoare ale căutării
Inventatori: Matthias Heiler, Michael Schaer, Nikola Todorovic, Robin Nittka, Thomas Fischbacher și Laura Dragoi;
Cesionar: Google LLC
Brevet SUA: 10.083.237
Acordat: 25 septembrie 2018
Depus: 31 august 2015

Abstract

Sunt descrise un sistem și o metodă pentru furnizarea unei experiențe de căutare în care utilizatorii sunt protejați de expunerea la conținut neadecvat ofensiv sau sensibil. Un sistem de căutare poate clasifica o interogare de căutare și rezultatele căutării candidate obținute ca răspuns la interogarea de căutare. Pe baza clasificării interogării de căutare și a rezultatelor căutării, rezultatele căutării candidatului pot fi modificate pentru a genera un set de rezultate de căutare prezentate unui utilizator, astfel încât rezultatele căutării prezentate să nu includă conținut neadecvat sensibil sau ofensator.

Unele definiții din brevetul privind rezultatele căutării sigure

Brevetul definește „conținut sensibil sau ofensator” pentru noi, ca referindu-se la, dar nu se limitează la, pornografie, imagini sângeroase și conținut violent.

De asemenea, definește „conținutul sensibil sau jignitor neadecvat” ca o subcategorie a conținutului sensibil sau jignitor și poate include conținut precum:

Conținut de recrutare a bandelor
Conținut care incită la violență
Conținut care batjocorește un anumit grup demografic sau care incită la ură împotriva unui anumit grup demografic
Conținut falsificat

„De asemenea, se poate referi, în general, la orice conținut care este ilegal, abuziv sau extrem de inacceptabil pentru o clasă protejată de utilizatori de internet.”

Brevetul ne spune, de asemenea, că urmărește să protejeze utilizatorii care ar putea fi sensibili la unele rezultate ale căutării:

Acea clasă protejată de utilizatori poate include orice grup de persoane care au cel puțin o caracteristică demografică în comun și pentru care se poate dori protecție împotriva conținutului neadecvat, sensibil sau ofensator.

Cum este tratat conținutul pentru adolescenți ca o clasă protejată

Descrierea brevetului privind rezultatele căutării sigure începe cu un exemplu de rezultate ale căutării care vizează adolescenții ca răspuns la o interogare precum „De ce adolescenții se alătură grupurilor”. Motorul de căutare primește acea interogare, obține un set de Rezultate de căutare, pentru a fi afișat ca răspuns la acea interogare.

Motorul de căutare primește, de asemenea, mai multe semnale de clasificare și selectează un set de rezultate de căutare din setul de rezultate de căutare candidați pentru a le prezenta unui utilizator de căutare copil, pe baza semnalelor de clasificare.

Unul dintre rezultatele căutării intitulat „Recrutare pentru adolescenți” primește un scor de relevanță de 96 și i se atribuie o etichetă care indică faptul că documentul cu rezultatele căutării care corespunde cu „Recrutare pentru adolescenți” include conținut care poate fi prezentat tuturor utilizatorilor, inclusiv unui utilizator copil, și nu nu include conținut sensibil sau ofensator.

Un alt rezultat este intitulat „Recrutori de bande de adolescenți” cu un scor de relevanță de 87 și i s-a atribuit o etichetă „v” care indică faptul că documentul cu rezultatele căutării care corespunde cu „Recrutari de bande de adolescenți” include probabil conținut violent sau imagini deranjante.

Alte rezultate ale căutării sunt intitulate „Știri: Grupuri de adolescenți” și „Grupuri de copii”, care au scoruri de relevanță de 79 și, respectiv, 34 și cu etichete atribuite care indică faptul că rezultatele căutării documentează corespunzând cu „Știri: Grupuri de adolescenți” și „Grupuri”. de copii” și probabil includ conținut care poate fi prezentat tuturor utilizatorilor, inclusiv unui utilizator copil, și nu includ conținut sensibil sau jignitor.

Pe baza semnalelor de clasificare utilizate, unele rezultate pot fi aprobate, unele pot fi eliminate, iar altele pot fi reclasificate înainte de a fi prezentate unui copil care caută.

Unele dintre rezultate pot fi reclasificate pentru a fi prezentate mai sus în rezultatele căutării, cum ar fi cel despre „Știri: Grupuri de adolescenți”.

Unele dintre rezultate pot fi reclasificate la un clasament mai scăzut, cum ar fi cel despre „Recrutari de bande de adolescenți”, care este probabil să aibă conținut violent asociat adolescenților.

Brevetul privind rezultatele căutării sigure ne spune că obiectivul acestei abordări este:

Setul selectat de rezultate ale căutării este apoi scos ca un set de prezentare al rezultatelor căutării pe dispozitivul utilizatorului, astfel încât utilizatorul copil să se poată bucura de o experiență de căutare sigură, fără a fi expus la conținut sensibil sau ofensator neadecvat.

Alte grupuri protejate și alte filtre

Brevetul privind rezultatele căutării sigure oferă alte exemple pentru alte grupuri, cum ar fi rezultatele despre

(i) „falsificarea avocatului de brevete” cu un scor de relevanță de 96 și o etichetă care indică faptul că documentul asociat cu rezultatul căutării intitulat „falsificarea avocatului de brevete” include probabil conținut neadecvat sensibil sau ofensator, cum ar fi conținut falsificat asociat cu o clasă protejată de persoane (de exemplu, avocații în brevete).

(ii) „Fasele la practicieni de PI” cu un scor de relevanță de 92 și o etichetă care indică faptul că documentul asociat cu rezultatul căutării intitulat „Fasele pe practicieni de PI” include probabil conținut neadecvat sensibil sau ofensator, cum ar fi glumele jignitoare adresate unei clase protejate al oamenilor;

(iii) „Momente amuzante pentru avocatul de brevete” cu un scor de relevanță de 89 și o etichetă care indică faptul că documentul asociat cu rezultatul căutării intitulat „Momente amuzante pentru avocatul de brevete” nu include probabil niciun conținut sensibil sau ofensator; și

(iv) „Umor un avocat” cu un scor de relevanță de 74 și o etichetă care indică faptul că documentul asociat cu rezultatul căutării intitulat „Umor un avocat” nu include probabil niciun conținut sensibil sau ofensator.

Brevetul ne spune ce conținut din aceste interogări a fost probabil eliminat sau reclasat.

Brevetul include și alte exemple care acoperă lucruri precum glume politice, meme politice și scandaluri politice.

De asemenea, oferă mai multe detalii despre modul în care motorul de căutare identifică conținutul pe care ar dori să îl filtreze.

Cea mai mare concluzie din brevetul privind rezultatele căutării sigure

Nu mai văzusem Google să spună nimic despre eliminarea sau reclasificarea rezultatelor căutării pe baza furnizării de rezultate sigure de căutare care implică grupuri protejate. Îmi amintesc totuși un caz legal împotriva Google în care un tribunal federal a decis încă din 2003 că PageRank era protejat de vorbire în temeiul Primului Amendament.