Google aktualizuje patent One Box

Opublikowany: 2017-05-04

Jaguary z Jacksonville

Kontynuacja patentu na Google Onebox pokazuje, w jaki sposób dane dotyczące doświadczenia użytkownika prawdopodobnie będą odgrywać większą rolę w określaniu, czy onebox pojawia się dla zestawu wyników wyszukiwania, w tym onebox dla zapytań do repozytorium faktów, takich jak Featured snippets

Co wiedzieliśmy o jednym pudełku?

W 2007 roku pisałem o patencie w Search Engine Land, który nazwałem Google's OneBox Patent Application. Ten patent mówił nam, że czasami Google może dodać kolejny wynik na górze zestawu wyników wyszukiwania, a ten dodatkowy wynik może pochodzić z różnych pionowych wyników wyszukiwania lub repozytoriów. Jeśli wyszukiwane hasło pojawiało się w wynikach wyszukiwania wiadomości, może pojawić się jedno pole z wynikami wiadomości. Jeśli wiele osób szukało zdjęć jaguarów w wyszukiwarce grafiki, a zapytanie brzmiało „jaguar”, to możliwe, że jedno pole może zawierać zdjęcia jaguarów. Gdybym szukał w Jacksonville, a był to poniedziałek po niedzieli wypełnionej meczami NFL, w tym jednym z Jacksonville Jaguarami, onebox mógłby zawierać historię sportową o grze Jaguara.

Zmiany w jednym pudełku

Google otrzymał w tym tygodniu zaktualizowaną wersję patentu z tego postu, który wydaje się, że wybrał jedną z wielu metod opisanych we wcześniejszej wersji patentu. Nowsza wersja patentu jest patentem kontynuacyjnym, który przyjmuje datę zgłoszenia wersji oryginalnej, ale aktualizuje sekcję roszczeń, aby odzwierciedlić sposób wykorzystania chronionego procesu.

W poście SearchEngineLand pisałem o tym, jak Google może identyfikować i wykorzystywać określone dane, aby zrozumieć, które repozytoria mają wyświetlać wyniki. W tym patencie opisano co najmniej siedem różnych metod, których może użyć do określenia rodzaju danych, które mają być wyświetlane wyszukiwarkom. Jedna z nich była najciekawszą metodą brzmieniową, więc pisałem o tym w moim poście. Patent kontynuacyjny wydaje się wskazywać na tę metodę jako podejście stosowane do decydowania o repozytorium:

Jedna odmiana opisuje proces, w którym zbierane są dane dziennika dotyczące osób wyszukujących i przeszukiwanych w repozytoriach. Dane dziennika są reprezentowane jako trójki danych (u, q, r), gdzie u to informacje o osobach wyszukujących, q to informacje o zapytaniu, a r to informacje o repozytoriach, z których pochodzą wyniki wyszukiwania. Tworzone są etykiety dla każdej z trójek danych (u, q, r), gdzie etykieta zawiera informacje o tym, czy użytkownik u żądał informacji z repozytorium r, gdy użytkownik podał zapytanie wyszukiwania q. Tworzone są instrukcje uczenia modelu w oparciu o trójki danych (u, q, r) i skojarzone z nimi etykiety, aby przewidzieć, czy konkretny użytkownik potrzebuje informacji z określonych repozytoriów podczas wprowadzania określonego zapytania wyszukiwania.

Repozytoria wybrane dla jednego pudełka na podstawie danych użytkownika, w tym kliknięć

Repozytorium to zbiór danych, który koncentruje się na pewnym aspekcie wyszukiwania, takim jak wyszukiwania oparte na wiadomościach, wyszukiwania oparte na obrazach, wyszukiwania oparte na lokalnych. Te różne typy wyszukiwań mają swoje unikalne czynniki rankingowe i ich wyniki. Firma Google poinformowała nas o dostępnym do przeglądania repozytorium opartym na faktach, z którego pochodzą wyniki typu odpowiedzi na zapytania, takie jak polecane fragmenty. Co ciekawe, Google prawdopodobnie użyje informacji o danych użytkownika, aby zdecydować, które repozytorium ma wyświetlać wyniki. Tak więc, gdy ktoś zdecyduje się kliknąć określony wynik – takie kliknięcia mogą określić, co widzą inne osoby, które wybierają to samo zapytanie do wyszukiwania

Warto przyjrzeć się zastrzeżeniom w nowej wersji patentu, podobnie jak zaktualizowana i chroniona wersja procesu opisanego przez Google. Można spróbować zrozumieć, co mogło się zmienić, patrząc na starszą i najnowszą wersję oświadczeń oraz sprawdzając, co zostało usunięte, a co dodane. Jedną z rzeczy, która od razu rzuciła mi się w oczy, były te wiersze z nowej wersji roszczeń:

4. Sposób według zastrzeżenia 1, w którym informacje są dostarczane w dokumencie z wynikami wyszukiwania, a metoda obejmuje: pozycjonowanie w dokumencie z wynikami wyszukiwania informacji na podstawie odpowiedniego wyniku dla każdego repozytorium z więcej niż jednego z wielu repozytoriów.

5. Sposób według zastrzeżenia 1, obejmujący ponadto: generowanie modelu w oparciu o informacje związane z danymi dziennika, przy czym informacje związane z danymi dziennika są tworzone w trójkach.

Myślałem, że część opisu patentu, która omawiała dane z dziennika zapytań, przedstawione jako trójki danych, aby przewidzieć, jakie informacje są pożądane z jakich repozytoriów, gdy wyszukiwane jest dane zapytanie, była interesująca, gdy przeczytałem to w 2007 roku. Wygląda na to, że Najnowsza wersja oświadczeń koncentruje się na przeglądaniu danych użytkownika, aby przewidzieć, jakie informacje z którego repozytorium mają wyświetlać wyszukiwarkom.

Ta nowsza wersja patentu znajduje się pod adresem:

Określenie żądanego repozytorium do pobierania wyników wyszukiwania
Wynalazcy: Michael Angelo, David Braginsky, Jeremy Ginsberg i Simon Tong
Przypisany: GOOGLE
Patent USA 9,639,579
Przyznano: 2 maja 2017 r.
Złożono: 27 lipca 2015 r.

Abstrakcyjny

System otrzymuje zapytanie wyszukiwania od użytkownika i przeszukuje grupę repozytoriów na podstawie zapytania wyszukiwania, aby zidentyfikować dla każdego z repozytoriów zestaw wyników wyszukiwania. System identyfikuje również jedno z repozytoriów na podstawie prawdopodobieństwa, że użytkownik potrzebuje informacji ze zidentyfikowanego repozytorium i przedstawia zestaw wyników wyszukiwania powiązanych ze zidentyfikowanym repozytorium.

Na wynos

Dzięki tej aktualizacji tego patentu wydaje się, że Google prawdopodobnie używa rodzaju danych użytkownika, które wskazałem w przypadkach kliknięć, które opisałem w moim pierwszym opisie tego patentu w 2007 roku, który zaczął się od następujących elementów:

Kraj, w którym znajduje się użytkownik u,
Język kraju, w którym znajduje się użytkownik u,
Identyfikator pliku cookie powiązany z użytkownikiem u,
Język zapytania q,
Każdy termin w zapytaniu q,
porę dnia, o której użytkownik u podał zapytanie q, dokumenty z repozytorium r, które zostały zaprezentowane użytkownikowi u,

To dopiero początek rodzaju danych, które Google może gromadzić, aby zbudować model prognozowania, aby zdecydować, z którego repozytorium wyświetlać informacje u góry wyników wyszukiwania.