Brevetul Google pentru site-uri de înaltă calitate

Publicat: 2016-12-08

urs panda

Este posibil să recunoașteți numele unuia dintre inventatorii brevetului despre care scriu o postare. A avut una dintre cele mai discutate actualizări Google, numită după el. Este cunoscut sub numele de Panda.

O postare pe blogul Google despre Panda se referă la aceasta ca actualizare de „site-uri de înaltă calitate”; acest brevet vorbește despre înlocuirea rezultatelor de căutare de rang înalt de pe site-uri de calitate scăzută cu rezultate de căutare de rang înalt de pe site-uri de înaltă calitate. Una dintre cele mai bune postări de blog despre Panda Update este aceasta de la Amit Singhal:

Mai multe îndrumări pentru construirea de site-uri de înaltă calitate

Este bine că postarea de blog detaliază multe despre ce este un site web de înaltă calitate, deoarece brevetul nu ne spune cum să facem distincția între un site de calitate scăzută și un site de înaltă calitate. Chiar și mai multe informații despre modul în care Google poate identifica site-uri de calitate scăzută și de înaltă calitate sunt explicate în acest interviu Wired cu Matt Cutts și Amit Singhal:

TED 2011: „Panda” care urăște fermele: Întrebări și răspunsuri cu cei mai buni ingineri de căutare ai Google

Acest brevet este interesant, deoarece oferă o privire în spatele actualizării Panda pentru a ne oferi o idee despre ce se întâmplă cu cei care caută în loc de proprietarii de site-uri atunci când au efectuat căutări și nu au ajuns pe site-urile fermei de conținut pe care ar fi trebuit să le facă Panda Update. abate-le de la. După cum spune brevetul, acesta „se concentrează pe îmbunătățirea rezultatelor căutării prin înlocuirea site-urilor web de calitate scăzută cu site-uri care au fost identificate ca site-uri de înaltă calitate”.

Aceasta a fost o problemă care a fost identificată în câteva locuri și observată în locuri proeminente, cum ar fi New York Times, care a observat Panda Update de la Google:

Google modifică algoritmul pentru a împinge site-urile de calitate scăzută

Acest brevet identifică paginile care se clasează bine pentru anumite interogări și se uită la calitatea acestor pagini. Dacă o cantitate limită din acele pagini de clasare sunt pagini de calitate scăzută, motorul de căutare poate utiliza o interogare alternativă pentru a găsi al doilea set de rezultate de căutare care includ pagini de pe site-uri de înaltă calitate. Acele rezultate ale căutării din prima interogare ar putea fi apoi îmbinate cu rezultatele din interogarea alternativă, paginile de pe site-urile de calitate scăzută fiind eliminate, astfel încât rezultatele căutării să includă un procent mai mare de pagini de pe site-uri de înaltă calitate.
Aspectul pozitiv al acestui rezultat este că rezultatele care au un prag ridicat de rezultate de la site-uri de calitate scăzută dispar și sunt înlocuite cu rezultate care includ site-uri de calitate superioară. Rezultatele căutării Google ajung să arate mai bine.

Rezultatele căutării îmbinate

Rezultatele căutării îmbinate

Brevetul nu definește ce este un site de înaltă calitate sau de calitate scăzută pentru noi. Postarea pe blog de la Amit Singhal face o treabă mai bună de a oferi „îndrumare” cu privire la ceea ce înseamnă acești termeni.

Brevetul nu discută despre pierderea traficului către site-urile de calitate scăzută care sunt eliminate din rezultatele căutării. Am auzit de la oameni care au fost afectați de Panda cât de mult trafic pierd pe site-urile lor.

Brevetul este:

Generarea selectivă de interogări alternative
Inventatorii Navneet Panda, April R. Lehman, Trystan G. Upstill
Cesionar inițial Google Inc.
Numărul publicației US9135307 B1
Tip publicație Grant
Numărul cererii US 13/728,851
Data publicării 15 septembrie 2015
Data depunerii 27 decembrie 2012

Abstract:

Metode, sisteme și aparate, inclusiv programe de calculator codificate pe medii de stocare computerizate, pentru obținerea de rezultate de căutare de pe site-uri de înaltă calitate. Una dintre metode include primirea de date care identifică primele resurse care răspund la o primă interogare. Dacă cel puțin un prim număr de prag N din primele resurse clasate în top sunt situate pe site-uri identificate anterior ca site-uri de calitate scăzută, se obțin o a doua interogare și date care identifică a doua resurse care răspund la a doua interogare, în care cel puțin un al doilea prag numărul M de resurse clasate în top sunt situate pe site-uri identificate anterior ca fiind site-uri de înaltă calitate. Rezultatele căutării sunt furnizate ca răspuns la prima interogare, în care rezultatele căutării identifică una sau mai multe dintre primele resurse și, de asemenea, identifică o a doua resursă particulară a celei de-a doua resurse.

Modul în care este definit un „site” în cadrul acestui brevet este interesant, iar acestea sunt alternativele oferite:

(1) o colecție de resurse care sunt găzduite pe un anumit server.
(2) Resursele dintr-un domeniu, de exemplu, „example.com”, unde resursele din domeniu, de exemplu, „host.example.com/resource1”, „www.example.com/folder/resource2” sau „ example.com/resource3”, sunt în site.
(3) Resursele dintr-un subdomeniu, de exemplu, „en.example.com”, unde resursele din subdomeniu, de exemplu, „en.example.com/resource1” sau „en.example.com/folder/resource2”, sunt pe site.
(4) Resursele dintr-un subdirector, de exemplu, „example.com/subdirectory”, unde resursele din subdirector, de exemplu, „example.com/subdirectory/resource.html”, sunt în site.

Se menționează scorurile de calitate a site-ului, dar nu și modul în care sunt determinate. Brevetul ne spune că motorul de căutare ar putea folosi o listă albă de site-uri de înaltă calitate și o listă neagră de site-uri de calitate scăzută pregătite manual sau printr-o altă metodă offline.

De asemenea, ni se spune că informațiile despre interogări pot fi colectate de-a lungul unui timp. Dacă o anumită cantitate din paginile de top pentru interogarea inițială se află pe site-uri de calitate scăzută, ar putea fi utilizată o a doua interogare bazată pe prima interogare. Brevetul ne spune că o modalitate prin care s-ar putea face acest lucru este utilizarea unei baze de date care „include termeni de interogare de substituție și poate genera o interogare alternativă prin înlocuirea unui termen de interogare de substituție cu unul dintre termenii de interogare din prima interogare”. Acest lucru mi-a adus aminte de câteva postări pe care le-am scris despre patentele Google, care acoperă termeni de interogare de substituție, așa cum am scris în:

  • Cum poate Google să înlocuiască termenii de interogare cu apariția concomitentă
  • Cum pot motoarele de căutare să înlocuiască alți termeni de căutare cu ai tăi
  • Investigarea Google RankBrain și înlocuirea termenilor de interogare

Ca alternativă, brevetul ne spune că motorul de căutare ar putea construi „un grafic conceptual al interogărilor și să traverseze graficul pentru a obține una sau mai multe interogări alternative”. Adică, „fiecare nod din grafic este definit de o interogare și de un set de rezultate de căutare de top, obținute pentru interogare. Legăturile dintre nodurile din grafic pot indica faptul că interogările sunt legate sau că o interogare este o interogare alternativă pentru o altă interogare.”

Ar fi foarte diferit de graficele de link la care ne gândim când vine vorba de Google, dar un mod interesant de a gândi cum ar putea fi găsite interogări alternative. Brevetul se bazează pe această abordare grafică și se pare că ar putea fi o metodă pe care au folosit-o.

Acest sistem de căutare poate evalua mai multe interogări alternative posibile înainte de a selecta una cu cea mai mare măsură de încredere.

Dacă setul de rezultate care include un prag îmbinat de site-uri de înaltă calitate, ar putea încerca să acumuleze mai multe rezultate alternative de interogare de la site-uri de înaltă calitate.

Concluzie

Acesta poate fi brevetul original de la Panda Update. Navneet Panda de la Google este unul dintre inventatorii brevetului, așa cum a fost dezvăluit în interviul Wired cu Cutts și Singhal. Și acest brevet vizează site-urile fermelor de conținut, ceea ce pentru care actualizarea originală Panda era cea mai cunoscută. Brevetul în sine nu dezvăluie diferențe între site-urile de calitate scăzută și cele de înaltă calitate și am aflat în Wired Interview că inginerul de căutare pe nume Panda a fost cel care a venit cu unele dintre întrebările inițiale care identifică diferențele dintre cele două.