Patent Google dotyczący witryn wysokiej jakości

Opublikowany: 2016-12-08

panda

Możesz rozpoznać nazwiska jednego z wynalazców patentu, o którym piszę. Jego imieniem nazwano jedną z najgłośniejszych aktualizacji Google. Jest znany jako Panda.

Post na blogu Google na temat Pandy określa ją jako aktualizację „witryny wysokiej jakości”; ten patent mówi o zastąpieniu wyników wyszukiwania o wysokiej pozycji z witryn o niskiej jakości wynikami wyszukiwania o wysokiej pozycji z witryn o wysokiej jakości. Jednym z najlepszych wpisów na blogu o Aktualizacji Pandy jest ten autorstwa Amita Singhala:

Więcej wskazówek dotyczących tworzenia witryn wysokiej jakości

To dobrze, że wpis na blogu zawiera wiele szczegółów na temat tego, czym jest witryna wysokiej jakości, ponieważ patent nie mówi nam, jak odróżnić witrynę niskiej jakości od wysokiej jakości. Jeszcze więcej informacji na temat sposobu, w jaki Google może identyfikować witryny niskiej jakości i wysokiej jakości, wyjaśniono w tym wywiadzie dla sieci Wired z Mattem Cuttsem i Amitem Singhalem:

TED 2011: „Panda”, która nienawidzi farm: pytania i odpowiedzi z najlepszymi wyszukiwarkami Google

Ten patent jest interesujący, ponieważ daje wgląd w Aktualizację Pandy, aby dać nam wyobrażenie o tym, co dzieje się z wyszukiwarkami, a nie właścicielami witryn, gdy przeprowadzali wyszukiwania i nie trafili na strony z farmą treści, które miała mieć Aktualizacja Pandy odwrócić ich od. Jak mówi patent, „koncentruje się na poprawie wyników wyszukiwania poprzez zastąpienie witryn o niskiej jakości witrynami, które zostały zidentyfikowane jako witryny wysokiej jakości”.

Był to problem, który został zidentyfikowany w kilku miejscach i odnotowany w widocznych miejscach, takich jak New York Times, który zauważył aktualizację Google Panda Update:

Google Tweaks Algorytm, aby odeprzeć witryny niskiej jakości

Ten patent identyfikuje strony, które mają dobrą pozycję w przypadku niektórych zapytań i sprawdza jakość tych stron. Jeśli progowa liczba stron w rankingu to strony niskiej jakości, wyszukiwarka może użyć alternatywnego zapytania, aby znaleźć drugi zestaw wyników wyszukiwania obejmujący strony z witryn o wysokiej jakości. Te wyniki wyszukiwania z pierwszego zapytania mogą być następnie scalane z wynikami zapytania alternatywnego, usuwając strony z witryn o niskiej jakości, dzięki czemu wyniki wyszukiwania obejmują większy odsetek stron z witryn o wysokiej jakości.
Pozytywnym aspektem tego wyniku jest to, że wyniki, które mają wysoki próg wyników z witryn o niskiej jakości, znikają i są zastępowane wynikami obejmującymi witryny o wyższej jakości. Wyniki wyszukiwania Google wyglądają lepiej.

Scalone wyniki wyszukiwania

Scalone wyniki wyszukiwania

Patent nie określa, czym jest dla nas strona wysokiej lub niskiej jakości. Wpis na blogu Amita Singhala lepiej sprawdza się w dostarczaniu „wskazówek” na temat znaczenia tych terminów.

Patent nie omawia utraty ruchu do witryn o niskiej jakości, które są usuwane z wyników wyszukiwania. Od osób, na które Panda wpłynęła, dowiedzieliśmy się, jak duży ruch tracą na swoich witrynach.

Patent to:

Selektywne generowanie alternatywnych zapytań
Wynalazcy Navneet Panda, April R. Lehman, Trystan G. Upstill
Pierwotny cesjonariusz Google Inc.
Numer publikacji US9135307 B1
Rodzaj publikacji Grant
Numer wniosku US 13/728,851
Data publikacji 15 września 2015 r.
Data zgłoszenia 27 grudnia 2012 r.

Abstrakcyjny:

Metody, systemy i urządzenia, w tym programy komputerowe zakodowane na komputerowych nośnikach pamięci, do uzyskiwania wyników wyszukiwania z witryn wysokiej jakości. Jedna z metod obejmuje odbieranie danych identyfikujących pierwsze zasoby, które odpowiadają na pierwsze zapytanie. Jeżeli co najmniej pierwsza liczba progowa N pierwszych zasobów o najwyższym rankingu znajduje się w witrynach wcześniej zidentyfikowanych jako witryny o niskiej jakości, uzyskuje się drugie zapytanie i dane identyfikujące drugie zasoby, które odpowiadają na drugie zapytanie, przy czym co najmniej drugi próg liczba M najwyżej sklasyfikowanych drugich zasobów znajduje się w witrynach wcześniej zidentyfikowanych jako witryny wysokiej jakości. Wyniki wyszukiwania są dostarczane w odpowiedzi na pierwsze zapytanie, przy czym wyniki wyszukiwania identyfikują jeden lub większą liczbę pierwszych zasobów, a także identyfikują konkretny drugi zasób z drugich zasobów.

Interesujące jest to, jak „witryna” jest zdefiniowana w tym patencie, a oto dostępne alternatywy:

(1) zbiór zasobów hostowanych na określonym serwerze.
(2) Zasoby w domenie, np. „example.com”, gdzie zasoby w domenie, np. „host.example.com/resource1”, „www.example.com/folder/resource2” lub „ example.com/resource3” znajdują się w witrynie.
(3) Zasoby w subdomenie, np. „en.example.com”, gdzie zasoby w subdomenie, np. „en.example.com/resource1” lub „en.example.com/folder/resource2” są na stronie.
(4) Zasoby w podkatalogu, np. „przyklad.com/podkatalog”, gdzie zasoby w podkatalogu, np. „przyklad.com/podkatalog/zasób.html”, znajdują się w witrynie.

Jest wzmianka o wynikach jakości witryny, ale nie o tym, jak są one ustalane. Patent mówi nam, że wyszukiwarka może korzystać z białej listy witryn o wysokiej jakości oraz czarnej listy witryn o niskiej jakości, przygotowanej ręcznie lub inną metodą offline.

Powiedziano nam również, że informacje o zapytaniach mogą być zbierane przez pewien czas. Jeśli pewna liczba stron zajmujących najwyższe pozycje w pierwszym zapytaniu znajduje się w witrynach o niskiej jakości, może zostać użyte drugie zapytanie oparte na tym pierwszym zapytaniu. Patent mówi nam, że jednym ze sposobów, w jaki może to zrobić, jest użycie bazy danych, która „zawiera zastępcze terminy w zapytaniu i może wygenerować alternatywne zapytanie, zastępując zastępczy termin w zapytaniu jednym z terminów w zapytaniu w pierwszym zapytaniu”. Przypomniało mi to kilka postów, które napisałem na temat patentów Google obejmujących zastępcze terminy zapytań, o których pisałem w:

  • Jak Google może zastępować warunki zapytania współwystępowaniem
  • W jaki sposób wyszukiwarki mogą zastąpić Twoje inne wyszukiwane hasła
  • Badanie podmian terminów Google RankBrain i zapytań

Jako alternatywę, patent mówi nam, że wyszukiwarka może stworzyć „konceptualny wykres zapytań i przejść przez wykres, aby uzyskać jedno lub więcej alternatywnych zapytań”. Oznacza to, że „każdy węzeł na wykresie jest zdefiniowany przez zapytanie i zestaw najwyżej ocenionych wyników wyszukiwania uzyskanych dla zapytania. Powiązania między węzłami na wykresie mogą wskazywać, że zapytania są powiązane lub że jedno zapytanie jest zapytaniem alternatywnym dla innego”.

Różniłoby się to bardzo od wykresów linków, o których myślimy, jeśli chodzi o Google, ale jest to interesujący sposób myślenia o tym, jak można znaleźć alternatywne zapytania. Patent opiera się na tym podejściu opartym na wykresie i wygląda na to, że może to być metoda, z której korzystali.

Ten system wyszukiwania może ocenić więcej niż jedno możliwe alternatywne zapytanie przed wybraniem takiego, które ma najwyższą miarę ufności.

Jeśli zestaw wyników zawiera scalony próg liczby witryn o wysokiej jakości, może próbować gromadzić więcej alternatywnych wyników zapytań z witryn o wysokiej jakości.

Wniosek

Może to być oryginalny patent z Aktualizacji Panda. Navneet Panda firmy Google jest jednym z wynalazców patentu, jak ujawniono w wywiadzie dla sieci Wired z Cuttsem i Singhalem. A patent ten dotyczy witryn z farmami treści, z których najbardziej znana była oryginalna aktualizacja Panda. Sam patent nie ujawnia różnic między witrynami o niskiej i wysokiej jakości, a w Wired Interview dowiedzieliśmy się, że to inżynier wyszukiwania o imieniu Panda wymyślił niektóre z początkowych pytań identyfikujących różnice między tymi dwoma.