Jak Google może przewidzieć intencję zapytania za pomocą historii kontekstowych

Opublikowany: 2018-11-29

Zrozumienie intencji zapytania stojącej za wyszukiwaniem

Taksonomia wyszukiwania w sieci (pdf) autorstwa Andrei Broder dotyczy różnic między zapytaniami informacyjnymi, transakcyjnymi i nawigacyjnymi. Warto o nich wiedzieć, optymalizując strony pod kątem terminów zapytań.

Czy spodziewasz się, że będziesz nauczać ludzi o jakimś koncepcie lub temacie? Jeśli tak, traktujesz ich zapytanie tak, jakby miało ono charakter informacyjny.

Tworzysz stronę, która ma na celu sprzedaż towarów lub usług? Wtedy traktujesz ich zapytanie tak, jakby dotyczyło transakcji, i umożliwiasz im coś kupić lub coś zarezerwować.

Zapytanie używane, aby pomóc komuś znaleźć stronę, której jest świadomy, ponieważ widział ją wcześniej lub spodziewa się, że istnieje i oczekuje, że zwrócona mu konkretna strona jest określana jako zapytanie nawigacyjne. Gdy ktoś szuka nazwy konkretnego produktu lub marki, będzie zadowolony ze strony głównej tego produktu lub marki.

Witryna, na której zacząłem robić SEO jako wewnętrzny SEO, pomogła ludziom włączyć firmy. Ta strona dobrze wypadła pod względem terminów takich jak „włącz się do Delaware”. Uzyskał więcej konwersji, gdy była drugą stroną w rankingu dla tego terminu, po witrynie Delaware Division of Corporations, która była witryną wyłącznie informacyjną, która nie oferowała odwiedzającym możliwości włączenia ich firm do Delaware.

Ludzie widzieli witrynę Division of Corporations w wynikach wyszukiwania, odwiedzali ją i poznawali proces, a następnie wracali do wyników wyszukiwania i odwiedzali witryny transakcyjne, takie jak moja, gdzie mogliby się włączyć. Był to przypadek, w którym bycie najwyżej notowaną stroną nie było zaletą. Zrozumienie intencji takich zapytań pomaga wyjaśnić, dlaczego tak się stało.

Więcej o intencji zapytania

Innym artykułem na temat intencji kryjących się za wyszukiwaniem i zapytaniami jest Prosty model klasyfikacji
Zapytania internetowe według intencji użytkownika (pdf) autorstwa D. Irazu Hernandeza, Partha Gupty, Paolo Rosso i Marthy Rocha. Zawiera kilka interesujących stwierdzeń dotyczących intencji zapytania, które warto powtórzyć, w tym to:

Klasyfikacja zapytań na podstawie intencji użytkownika ma na celu klasyfikację zapytań pod kątem potrzeb kryjących się za zapytaniami. Jansen i Booth [4] definiują intencję użytkownika jako wyrażenie afektywnego, poznawczego lub sytuacyjnego celu w interakcji z wyszukiwarką internetową. Klasyfikacja zapytań na podstawie intencji użytkownika różni się od tradycyjnej klasyfikacji tekstu głównie z dwóch powodów [2]: po pierwsze, zapytania internetowe są zwykle bardzo krótkie; po drugie, wiele zapytań jest niejednoznacznych i często zdarza się, że zapytanie należy do wielu kategorii. Na przykład dla zapytania „bilety do teatru operowego” trudno jest określić, czy użytkownik chce poznać stronę internetową, czy kupić bilety na wydarzenie. Większość wysiłków obejmowała zwykle niewielką liczbę ręcznie klasyfikowanych zapytań.

Chociaż ten artykuł zawiera kilka pomysłów i podejść do lepszego zrozumienia intencji zapytania, podobało mi się, w jaki sposób sformułował problem, który miał rozwiązać. W zgłoszeniu patentowym Google, które opublikowano w zeszłym tygodniu, opisano, w jaki sposób wyszukiwarka może próbować zrozumieć kontekst wyszukiwań, aby lepiej zrozumieć intencje osoby wyszukującej stojące za ich zapytaniami.

Patent Google na przewidywanie intencji zapytania na podstawie kontekstu

Nie jest to nowa koncepcja, że ​​możemy powiązać intencję z zapytaniem i że Google może spróbować to zrobić, aby zrozumieć, czego szuka dana osoba, a następnie wpisz kilka słów w polu wyszukiwania. To, co wydaje się nowe w tym patencie, to to, ile wysiłku może włożyć Google, aby zrozumieć intencję zapytania. Gdy ktoś wpisze w Google słowo „pizza” w porze lunchu, możemy się domyślić, że może być zainteresowany jedzeniem i być może szukaniem miejsca, w którym mógłby kupić pizzę lub które mogłoby mu dostarczyć.

Jest prawdopodobnie mniej prawdopodobne, że szukają historii pizzy na przestrzeni czasu (ale mogą być). Ile kontekstu może być potrzebne, aby takie założenia były trafne dla większości wyszukiwań?

Podobnie jak większość patentów, ten nowy od Google mówi nam o problemie, który ma rozwiązać:

Jeśli zapytanie nie jest ściśle dopasowane lub jeśli użytkownik nie dostarcza wielu dodatkowych informacji poza zapytaniem, urządzenie komputerowe może zwrócić zbyt wiele informacji; niektóre z najciekawszych lub najbardziej istotnych informacji są trudne do znalezienia przez użytkownika. Użytkownik może odczuwać stres i/lub marnować cenny czas i zasoby na wprowadzanie bardzo szczegółowych zapytań do urządzenia komputerowego, powodując, że urządzenie komputerowe wykonuje wiele wyszukiwań lub przegląda duże ilości wyników wyszukiwania, aby uzyskać informacje niezbędne do wykonania określonego zadania .

Jeśli poszukiwacz jest głodny i chce szybko napić się pizzy, jego zadowolenie z wyszukiwarki może gwałtownie wzrosnąć, jeśli może ona zidentyfikować pobliską lokalizację, która może dostarczyć smaczną pizzę.

Używanie kontekstu do przewidywania intencji zapytania

intencje zapytania schemat blokowy historii kontekstowej patentu

Intencja zapytania może być wykorzystana do umożliwienia wyszukiwarce dostosowania wyników wyszukiwania zwróconych z wyszukiwania, tak aby informacje spełniające intencję były wyróżnione w stosunku do innych informacji zwracanych z wyszukiwania.

Patent daje nam przykład kogoś, kto szuka filmu, na który właśnie kupił bilety. System może być w stanie przejrzeć dane dziennika i ustalić, że osoba wyszukująca już kupiła bilety na przyszły seans tego filmu, a także może dostosować wyniki tak, aby „repertuary filmowe miały niższą pozycję w rankingu niż inne informacje (np. recenzje, pamiątki , ciekawostki itp.) o konkretnym filmie.”

Jesteśmy zaznajomieni z wyszukiwarką zbierającą informacje o poprzednich wyszukiwaniach, które przeprowadziliśmy, aby spersonalizować wyniki, które możemy zobaczyć, ale to użycie kontekstu mające na celu zmniejszenie stresu lub uniknięcie marnowania czasu jest inne.

Zgłoszenie patentowe mówi nam, że może przeglądać takie informacje kontekstowe tylko po otrzymaniu zgody od osoby korzystającej z wyszukiwarki do analizy tych informacji. Patent zawiera dodatkowe przykłady wykorzystania informacji kontekstowych, które mogą zmienić kolejność wyników wyszukiwania, które mogą pokazywać wyszukiwarce.

Należy pamiętać, że jest to wciąż oczekujące zgłoszenie patentowe i prawdopodobnie nie zostało jeszcze wdrożone, ale może nastąpić na pewnym etapie w przyszłości i że prawdopodobnie Google zwraca uwagę na kontekst, aby przewidzieć intencje stojące za zapytaniami, oraz może już używać takich rzeczy jak pora dnia, dzień roku i lokalizacja.

Patent mówi nam, że ograniczy wykorzystanie niektórych informacji, na przykład takich, które mogą ujawnić informacje umożliwiające identyfikację osoby wyszukującej.

To nowo opublikowane zgłoszenie patentowe można znaleźć pod adresem:

Przewidywanie zamiaru poszukiwania określonego kontekstu
Numer publikacji: 20180336200
Data publikacji: 22 listopada 2018 r.
Wnioskodawcy: Google Inc.
Wynalazcy: Yew Jin Lim, Joseph Linn, Yuling Liang, Carsten Steinebach, Wei Lwun Lu, Dong Hyun Kim, James Kun, Lauren Koepnick i Min Yang

Abstrakcyjny:

Opisano system obliczeniowy, który określa, na podstawie działań inicjowanych przez użytkownika, wykonanych przez grupę urządzeń obliczeniowych, oraz zamiar wyszukiwania przy użyciu określonego zapytania wyszukiwania otrzymanego z urządzenia komputerowego. System obliczeniowy dostosowuje, na podstawie intencji, przynajmniej określoną część wyników wyszukiwania uzyskanych z wyszukiwania przy użyciu zapytania wyszukiwania, podkreślając informacje, które spełniają intencję. System obliczeniowy wysyła do urządzenia obliczeniowego informację o skorygowanych wynikach wyszukiwania.

Przykłady historii kontekstowej

Zgłoszenie patentowe informuje nas o niektórych rodzajach informacji kontekstowych, które mogą być wykorzystywane do przewidywania intencji zapytania, w tym o liście rzeczy, które określają jako interesujące tematy, które można znaleźć patrząc na takie rzeczy, jak:

  • Wykres zainteresowań użytkowników lub inny rodzaj struktury danych
  • Informacje kontaktowe powiązane z użytkownikami (np. osobiste dane kontaktowe użytkownika, a także informacje o przyjaciołach, współpracownikach użytkownika, powiązaniach z mediami społecznościowymi, rodzinie itp.)
  • Historie wyszukiwania
  • Historie lokalizacji
  • Zadania długoterminowe i krótkoterminowe
  • Informacje o kalendarzu
  • Historie użytkowania aplikacji
  • Historie zakupów
  • Ulubione
  • Zakładki
  • Inne informacje

Oprócz tych rzeczy o charakterze osobistym, zawierają one inne informacje kontekstowe.

O stanie pracy urządzenia komputerowego (i tutaj dokopują się głęboko.):

  • Pozycje przełączników
  • Poziomy baterii
  • Czy urządzenie jest podłączone do gniazdka ściennego lub w inny sposób operacyjnie połączone z innym urządzeniem i/lub maszyną
  • Informacje uwierzytelniające użytkownika (np. który użytkownik jest aktualnie uwierzytelniony lub jest bieżącym użytkownikiem urządzenia)
  • Czy urządzenie działa w trybie „samolotowym”, w trybie gotowości, w trybie pełnej mocy

Inne przykłady informacji kontekstowych:

  • Akustyczny odcisk palca
  • Odcisk palca wideo
  • Lokacja
  • Trajektoria ruchu
  • Kierunek
  • Prędkość
  • Nazwa zakładu
  • Adres ulicy
  • Rodzaj miejsca
  • Budynek
  • Warunki pogodowe
  • Warunki drogowe
  • Wydarzenie w kalendarzu
  • Spotkanie lub inne wydarzenie związane z lokalizacją i/lub czasem
  • Adres strony internetowej oglądany w określonym czasie
  • Jeden lub więcej wpisów tekstowych wprowadzonych w polach danych stron internetowych w określonym czasie, w tym historii wyszukiwania lub przeglądania
  • zakupy produktów dokonywane w określonych godzinach
  • listy życzeń produktów
  • Rejestry produktów
  • Dźwięk i/lub wideo dostępne lub transmitowane w obecności urządzenia komputerowego w różnych lokalizacjach i o różnych porach
  • Transmisje telewizyjne lub kablowe/satelitarne, do których uzyskuje się dostęp lub są nadawane w obecności urządzenia komputerowego w różnych lokalizacjach i o różnych porach
  • Informacje o innych usługach, do których urządzenie komputerowe uzyskuje dostęp w różnych miejscach i czasie.

Widzimy inne rodzaje informacji pojawiające się w tym patencie, takie jak historia lokalizacji mobilnej, o której pisałem już wcześniej.

Zgłoszenie patentowe mówi nam, w jaki sposób może indeksować takie konteksty, aby umożliwić mu wyszukiwanie informacji, które mogą być istotne dla zapytania, co może spowodować uzupełnienie lub modyfikację wyników wyszukiwania takiego zapytania.

Mówi nam również, że może utrzymywać historie wyszukiwania, niezależnie od historii kontekstowych, które wyszukiwarka może przechowywać w odniesieniu do wyszukiwań i urządzeń, na których przeprowadzane są wyszukiwania. Google może nie przesłuchiwać osoby wyszukującej pod kątem jej zamiarów związanych z wyszukiwaniem, ale wygląda na to, że mogą oni dużo dowiedzieć się o osobach i maszynach stojących za wyszukiwaniem, aby dać im możliwość przewidzenia, co ma się wyświetlać w wynikach wyszukiwania.

Uczenie maszynowe w celu określenia intencji zapytania

Patent Google mówi nam, że proces, który za nim stoi, obejmuje zbieranie wielu informacji. Może dokonywać przewidywań po odfiltrowaniu niepotrzebnych informacji, aby „zdefiniować wąski kontekst, aby można było wywnioskować prawdziwą intencję zapytania”.

Patent mówi nam, w jaki sposób może wykorzystać głębokie uczenie do pomocy w tym zadaniu:

Moduł predykcji może wykonywać model uczenia maszynowego (np. model uczenia głębokiego), który odbiera jako dane wejściowe: zapytanie wyszukiwania (lub część zapytania wyszukiwania) oraz bieżący kontekst otrzymany z modułu kontekstu. Model uczenia maszynowego może generować jako dane wyjściowe wskazanie (takie jak etykieta lub inny identyfikator) zamiaru wyszukiwania przy użyciu zapytania wyszukiwania dla bieżącego kontekstu.

Wniosek

Patent zawiera szczegółowe informacje na temat predefiniowanych intencji (takich jak podróże) i wyników intencji oraz sposobu, w jaki dane użytkownika mogą trenować uczenie maszynowe w zakresie intencji zapytania.

Jest to zgłoszenie patentowe, a firma Google mogła nie wdrożyć tworzenia takich historii kontekstowych i dostosowywania na ich podstawie wyników wyszukiwania. Należy również pamiętać, że patent mówi, że prawdopodobnie poproszą o pozwolenie, zanim przeanalizują takie dane kontekstowe.

Aby powtórzyć intencję zapytania na podstawie przykładu kontekstu, który udostępniłem powyżej:

  1. Kupujesz bilety do kina
  2. Wyszukujesz ten film
  3. Wyszukiwarka zauważy Twoją historię zakupów
  4. Zamiast pokazywać Ci godziny seansów dla innych seansów tego samego filmu, Twoje wyniki wyszukiwania mogą zostać dostosowane tak, aby pokazywać Ci ciekawostki, pamiątki i wiadomości o filmie

Chociaż Google dogłębnie śledzi historię wyszukiwania i historię lokalizacji, to zrozumienie zamiaru zapytania i wykorzystania historii kontekstowej może potencjalnie zmienić rankingi znacznie bardziej niż personalizacja wyszukiwania.