Jak Google może przepisywać zapytania, patrząc na wcześniejsze zapytania wyszukiwarek

Opublikowany: 2019-08-24

Ile osób ma stadion Mudville (gdzie Mighty Casey wybił się)?

Na początku tego tygodnia Google otrzymał nowy patent na przepisywanie zapytań. Nie działa w taki sam sposób, jak Hummingbird Google ani jak działa Rankbrain Google.

Widzieliśmy patenty dotyczące przepisywania zapytań, które mogą wyszukiwać osoby wyszukujące, z powracającymi stronami, które spełniają potrzeby informacyjne osoby wyszukującej. To są pomysły stojące za aktualizacją Hummingbird firmy Google i innymi patentami Google dotyczącymi używania synonimów do przepisywania zapytań.

Na poniższym rysunku z patentu Hummingbird słowo „miejsce” dla Chicago Style Pizza można przepisać na „restauracja”, na co Google łatwiej odpowiedzieć jako zapytanie.

Synonimy Google Hummingbirs według kontekstu

W swoim poście pisałem o patencie opisującym podejście do przepisywania zapytań stosowane przez Hummingbirda The Google Hummingbird Patent? W tym poście pisałem o patencie Google przyznanym dwa tygodnie przed ogłoszeniem przez Google aktualizacji Hummingbird, która wraz z ogłoszeniem zawierała kilka przykładów przepisywania zapytań. Patentem była identyfikacja Synonimu na podstawie współwystępujących terminów.

Na wydarzeniu zapowiadającym Koliber wydali następujące oświadczenie na temat aktualizacji:

W szczególności Google powiedział, że Hummingbird zwraca większą uwagę na każde słowo w zapytaniu, zapewniając, że całe zapytanie — całe zdanie, rozmowa lub znaczenie — jest brane pod uwagę, a nie poszczególne słowa. Celem jest, aby strony pasujące do znaczenia działały lepiej, a nie strony pasujące tylko do kilku słów.

~ Często zadawane pytania: Wszystko o nowym algorytmie „Koliber” Google

W zapytaniu „Jakie jest najlepsze miejsce na pizzę w stylu Chicago” patent ten mówi nam, że słowo „miejsce” można zastąpić słowem „restauracja”, co ułatwiłoby wyszukiwarce udzielenie odpowiedzi.

Ten nowy patent może posłużyć się własnymi słowami poszukiwacza, aby przepisać zapytanie. Może sprawdzić, jakie zapytania mogli wykonać wcześniej, aby pomóc im znaleźć to, co chcą znaleźć. Mam zamiar przedstawić podsumowanie procesu stojącego za patentem, a następnie przykład tego, jak poprzednie zapytania mogą pomóc przepisać zapytanie wyszukiwacza.

Przepisywanie zapytań przy użyciu poprzednich zapytań

Oto kroki określone w nowym przyznanym patencie, które szczegółowo opisują proces, który za nim stoi:

  1. Wyszukiwarka otrzymuje zapytanie od osoby wyszukującej
  2. Wyszukiwarka mogła otrzymać kilka wcześniejszych zapytań od tej samej wyszukiwarki podczas tej samej sesji
  3. Wyszukiwarka może utworzyć wiele przepisanych zapytań kandydujących na podstawie najnowszego zapytania wyszukiwania i wcześniejszych zapytań wyszukiwania tego samego wyszukiwacza
  4. Te kandydujące przepisania zapytania są oceniane na podstawie określenia jakości przepisania z analizy wyników wyszukiwania odpowiadających kandydującemu przepisaniu zapytania
  5. Kandydujące przepisanie zapytania jest wybierane na podstawie wyniku, który spełnia wartość progową
  6. Te wyniki wyszukiwania z wybranego przepisania zapytania kandydującego są wyświetlane wyszukiwarce

Patent mówi nam, że istnieje kilka opcjonalnych funkcji związanych z tym podejściem do przepisywania zapytań. Pomyślałem, że to interesujące, że włączenie jednostek do poprzednich zapytań było interesującym aspektem tego podejścia do przepisywania.

Te opcjonalne kroki uzupełniają kroki wymienione powyżej.

  1. Tworzenie liczby potencjalnych przepisywania zapytań może oznaczać łączenie oryginalnego zapytania z każdym poprzednim zapytaniem wyszukiwania
  2. Każde poprzednie zapytanie ma sygnaturę czasową, a część oceniania przepisanych zapytań kandydujących może obejmować ważenie przepisanych zapytań kandydujących na podstawie wieku wcześniejszych zapytań.
  3. Utworzenie takiej liczby przepisanych zapytań kandydujących może obejmować identyfikowanie zapytań z kolekcji zapytań od kilku użytkowników, które są podobne do zapytania wyszukiwania.
  4. Ocenianie kandydujących przepisywania zapytań obejmuje również określenie, jak popularne jest każde kandydujące przepisanie zapytania, na podstawie zbioru zapytań od wielu użytkowników.
  5. Ocena każdego z przepisanych zapytań kandydujących może również obejmować określenie, czy zawiera ono termin referencyjny określonego typu (prawdopodobnie odwołanie do encji)
  6. Punktacja za ponowne przepisanie zapytania kandydującego może zostać zwiększona w odpowiedzi na ustalenie, że przepisane zapytanie kandydujące obejmuje jednostkę określonego typu.
  7. Ocena każdego przepisanego zapytania kandydującego obejmuje również określenie, czy zapytanie wyszukiwania zawiera terminy, które są wysoce skorelowane z określonymi jednostkami.
  8. Wynik ponownego przepisania zapytania kandydującego można zwiększyć w odpowiedzi na stwierdzenie, że przepisane zapytanie kandydujące obejmuje jednostkę wysoce skorelowaną z terminem zapytania.
  9. Określanie jakości każdego przepisywanego zapytania kandydującego na podstawie analizy wyników wyszukiwania odpowiadających przepisanemu zapytaniu kandydującemu obejmuje uzyskanie wyników wyszukiwania odpowiadających każdemu przepisanemu zapytaniu kandydującemu i określenie jakości wyników wyszukiwania.

To podejście polegające na przepisaniu zapytania nie polega na zrozumieniu kontekstu wszystkich słów w zapytaniu i przepisaniu ich w sposób, który z większym prawdopodobieństwem zwróci wynik przydatny dla osoby wyszukującej. Rozwija się to poprzez umożliwienie wyszukiwarce zrozumienia kontekstu kilku zapytań z tej samej sesji zapytań oraz tego, czy mogą one pomóc w udzieleniu odpowiedzi, która zadowoli poszukiwacza. Patent mówi nam, że zaletą procesu z tego patentu jest:

Używanie zapytań z poprzednich sesji użytkownika do przepisywania zapytań zwiększa prawdopodobieństwo zwrócenia wyników wyszukiwania odpowiadających intencji użytkownika.

Ten patent na przepisywanie zapytań to:

Przepisywanie zapytań przy użyciu informacji o sesji
Wynalazcy: Marcin M. Nowak-Przygodzki i Behshad Behzadi
Pełnomocnik: Google LLC
Patent USA: 10 387 437
Przyznano: 20 sierpnia 2019 r.
Złożono: 13 stycznia 2017 r.

Abstrakcyjny

Metody, systemy i aparatura, w tym programy komputerowe zakodowane na komputerowych nośnikach pamięci, do przetwarzania języka naturalnego. Jedna z metod obejmuje otrzymywanie zapytania wyszukiwania od użytkownika podczas sesji użytkownika; uzyskanie wielu wcześniejszych zapytań wyszukiwania przez użytkownika otrzymanych podczas sesji użytkownika; generowanie wielu przepisanych zapytań kandydujących, przy czym przepisane zapytania kandydujące pochodzą z zapytania wyszukiwania i wielu wcześniejszych zapytań wyszukiwania przez użytkownika; ocenianie każdego przepisywanego kandydującego zapytania, przy czym ocenianie każdego przepisywanego kandydującego zapytania obejmuje określanie jakości każdego przepisanego kandydującego zapytania w oparciu o analizę wyników wyszukiwania odpowiadających przepisanemu kandydującemu zapytaniu; wybieranie przepisanego zapytania kandydującego, które ma wynik spełniający wartość progową, oraz dostarczanie wyników wyszukiwania odpowiadających przepisanemu przepisanemu zapytaniu kandydującemu.

Testy przepisywania zapytań i na wynos

Wypróbowałem zapytania z przykładu wymienionego w tym patencie i nie przepisałem mojego zapytania dla mnie. Zawsze testuj takie rzeczy, niezależnie od tego, czy to piszę, czy też natkniesz się na patent na własną rękę, i brzmi to interesująco – zobacz, czy Google robi to, co mówi patent, czy też wdrożyło coś, co pokazuje, że idą w tym kierunku.

Niedawno napisałem post, w którym wyniki jakości wizyt w firmach mogą wpływać na rankingi w wyszukiwarce lokalnej Google i nie można stwierdzić, czy wykorzystują one wysokiej jakości wyniki wizyt do podnoszenia rankingów wyników lokalnych, ale istnieją inne oznaki, że Google może zmierzać w kierunku coś takiego. Pierwszym z nich jest to, że Google prezentuje wysokiej jakości informacje o wizytach w Google Analytics 360. Drugim jest to, że niedawny post na blogu Google dla webmasterów powiedział nam, że Google będzie przyznawać plakietki w różnych kategoriach biznesowych firmom, które znalazły się w pierwszej piątce % odwiedzonych witryn w swoich kategoriach. Szukaj więc oznak, że procesy opisane w patentach są w użyciu.

Przykłady z tego patentu obejmują wyszukiwanie za pomocą następujących zapytań:

[Stadion Mudville]
[Mudville Dziewiątka]
[Barack Obama]

Następne zapytanie to:

[jaka jest pojemność]

Odnosiłoby się to do pierwszego z poprzednich zapytań.

Kandydujące zapytanie przepisane na podstawie połączenia tego zapytania z pierwszym wcześniejszym zapytaniem wyglądałoby tak:

[jaka jest pojemność stadionu Mudville?]

Odnosi się również do właściwości podmiotu wymienionego w pierwszym zapytaniu (pojemność stadionu), która pasuje do opcjonalnych funkcji, na podstawie których przepisane zapytanie kandydata zostałoby wysoko ocenione.

Google nie łączy w tej chwili tego ostatniego zapytania z pierwszym i zwraca wyniki, które pokazują mi pojemność stadionu Mudville. Z drugiej strony nie jestem pewien, czy istnieje prawdziwy stadion Mudville (na którym odbyło się wydarzenie Casey At the Bat, więc spróbowałem tego samego zestawu zapytań, zastępując stadion Mudville stadionem Lincoln Financial Field (który jest prawdziwy) i Google zrobiło to nie mów mi też o pojemności Lincoln Financial Field. Przynajmniej jeszcze nie. Spróbuję ponownie.