Google zmienia sposób, w jaki rozumieją nazwy miejsc na Grafie wiedzy

Opublikowany: 2018-02-16

Nazwy miejsc w Grafie wiedzy Google

Zanim firma Google stworzyła Graf wiedzy, zbudowała repozytorium faktów. Firma Google złożyła wniosek patentowy na swoje dostępne do przeglądania repozytorium faktów w 2006 roku i pisałem o tym patencie w poście zatytułowanym „Przeglądalne repozytorium faktów Google – wczesny wykres wiedzy”. Jednym ze współtwórców Repozytorium Faktów był Andrew W. Hogue, który kierował projektem w Google określanym jako Annotation Framework, a także był zaangażowany w przejęcie przez Google Meta Web, która zbudowała bazę wiedzy znane jako Freebase, które doprowadziły do utworzenia Grafu wiedzy w Google. Gdy zobaczysz Repozytorium faktów w Google, pomyśl o Bazie wiedzy.

Jednym z ważnych typów faktów pojawiających się w zbiorach dokumentów, takich jak Internet, są nazwy miejsc.

Google otrzymał patent, który został pierwotnie zgłoszony w 2007 roku pod nazwą Określanie lokalizacji geograficznych dla nazw miejsc w repozytorium faktów.

Jak niedawno pisałem w poście Podobne wyniki encji w wyszukiwaniach opartych na wiedzy, Google może wykorzystywać informacje o właściwościach encji do dostarczania wyników wyszukiwania. Tak więc, gdy Google wyodrębnia dane do bazy wiedzy, takie jak nazwa miejsca, jest to ważny fakt, który może być pomocny w uzyskaniu poprawności. Baza wiedzy jest bogatsza i bardziej przydatna, jeśli chodzi o poprawność tego rodzaju informacji.

Zaktualizowany patent Google na nazwy miejsc

W tym tygodniu Google otrzymało kontynuację swojego patentu na nazwy miejsc i repozytoria faktów. Patent kontynuacyjny to zaktualizowany patent, który wykorzystuje pierwotną datę zgłoszenia patentu, który jest kontynuowany i zwykle zawiera ten sam bardzo podobny tekst opisu i obrazy, ale ma zaktualizowane zastrzeżenia. Jeśli przyjrzymy się oryginalnemu patentowi zgłoszonemu w 2007 r. i patentowi kontynuacyjnemu zgłoszonemu w 2012 r., widzimy, że zastrzeżenia zostały zmienione z wcześniejszego patentu na ten nowszy i niedawno przyznany patent.

Jedną z obaw, która, jak się wydaje, odegrała ważną rolę w pierwszej wersji patentu, było poprawność faktów dotyczących nazw miejscowości. Patent mówi nam o tej trosce:

Nazwy miejsc pobierane z różnych źródeł mają różne formaty i mogą zawierać błędy typograficzne, pominięcia lub niejasny język. Może też istnieć niejasność co do tego, czy słowo reprezentuje nazwę miejsca i czy różne nazwy miejsc reprezentują tę samą lokalizację. Warto mieć sposób na określenie dokładnej lokalizacji nazwy miejsca.

Roszczenia z pierwszej wersji patentu przypomniały mi post, który napisałem, zatytułowany Jak Google potwierdzał fakty dla bezpośrednich odpowiedzi.

Widzimy takie linie, które zostały usunięte z roszczeń w drugiej wersji patentu:

2. Sposób według zastrzeżenia 1, w którym identyfikowanie pierwszej potencjalnej nazwy miejsca obejmuje badanie sekwencji jednego lub większej liczby słów pisanych wielką literą.

3. Sposób według zastrzeżenia 1, w którym identyfikowanie pierwszej potencjalnej nazwy miejsca obejmuje identyfikowanie drugiej potencjalnej nazwy miejsca w wartości i badanie słów otaczających drugą potencjalną nazwę miejsca.
4. Sposób według zastrzeżenia 1, w którym identyfikowanie pierwszej potencjalnej nazwy miejsca obejmuje identyfikowanie różnych reprezentacji tej samej nazwy miejsca.
5. Metoda według zastrzeżenia 1, w której atrybut został określony jako odpowiadający nazwie miejsca przez porównanie faktów zawierających ten sam atrybut

Przypomina mi się spójność NAP (Nazwa, adres, numer telefonu) omawiana we wzmiankach o miejscu w lokalnym wyszukiwaniu Google.

Nowa wersja patentu w znacznie większym stopniu skupia się na oznaczaniu nazw miejsc, ponieważ są one wymieniane za pomocą współrzędnych geograficznych, takich jak szerokość i długość geograficzna (jak widać na ilustracjach patentowych). Jeśli przyjrzymy się niektórym początkowym roszczeniom dotyczącym nowego patentu, zobaczymy to nowe skupienie:

2. Sposób według zastrzeżenia 1, w którym przechowywanie współrzędnych pierwszej lokalizacji geograficznej obejmuje oznaczanie pierwszej potencjalnej nazwy miejsca za pomocą współrzędnych pierwszej lokalizacji geograficznej.
3. Sposób według zastrzeżenia 2, w którym tagowanie obejmuje konwersję pierwszej potencjalnej nazwy miejsca na hiperłącze do widoku mapy.

4. Sposób według zastrzeżenia 1, w którym ujednoznacznienie między możliwymi konfliktowymi współrzędnymi położenia geograficznego obejmuje badanie dokumentu źródłowego z dokumentów źródłowych pod kątem kontekstu.
5. Sposób według zastrzeżenia 1, w którym określanie współrzędnych położenia geograficznego dla pierwszej potencjalnej nazwy miejsca obejmuje badanie wielu nazw miejsc. Każda z wielu nazw miejscowości została wcześniej oznaczona odpowiednimi współrzędnymi położenia geograficznego.

Nowa wersja patentu jest tutaj:

Określanie lokalizacji geograficznych nazw miejsc w repozytorium faktów
Wynalazcy: David J. Vespe i Andrew Hogue
Pełnomocnik: Google LLC
Patent USA: 9 892 132
Przyznano: 13 lutego 2018 r.
Złożony: 31 grudnia 2012 r.

Abstrakcyjny

System i metoda oznaczania nazw miejsc współrzędnymi położenia geograficznego, nazwami miejsc powiązanymi z kolekcją obiektów w pamięci systemu komputerowego. System i metoda przetwarzają ciąg tekstowy w obiekcie przechowywanym w pamięci, aby zidentyfikować pierwszą potencjalną nazwę miejsca. System i metoda określają, czy współrzędne położenia geograficznego są znane dla pierwszej potencjalnej nazwy miejsca. System i metoda identyfikują pierwszą potencjalną nazwę miejsca powiązaną z obiektem w pamięci jako nazwę miejsca. System i metoda znakują pierwszą zidentyfikowaną nazwę miejsca skojarzoną z obiektem w pamięci za pomocą jego współrzędnych lokalizacji geograficznej, gdy znane są współrzędne lokalizacji geograficznej dla pierwszej zidentyfikowanej nazwy miejsca. System i metoda rozróżniają nazwy miejsc w przypadku znalezienia wielu nazw miejsc.

Refleksje na temat nazw miejsc

Ktoś zapytał mnie na Twitterze, czy patenty czasami stały się bezużyteczne i przestały być wykorzystywane przez wyszukiwarki, czy też wyszukiwarki zostały zmuszone do korzystania z wynalazków, które opatentowały, ponieważ zostało im jeszcze trochę czasu. Patenty wygasają. Patent na jedno kliknięcie, który nabył Amazon, wygasł, podobnie jak oryginalny patent PageRank należący do Uniwersytetu Stanforda (i licencjonowany przez Google) wygasł. Kiedy proces zostanie opracowany i opatentowany, proces związany z patentem może się zmienić i może zostać złożony patent kontynuacyjny, taki jak ten, o którym pisałem w tym poście.

Jeśli będziesz mieć na nie oko, patenty kontynuacyjne mogą dostarczyć wskazówek na temat zmian w podejściu, które firma może przyjąć. Na przykład, w tym patencie na nazwę miejsca, wydaje się, że nacisk kładzie się na przenoszenie się z potwierdzających faktów opartych na spójności pisowni i wspomnianych faktów dotyczących określonych podmiotów na pewne fakty, które mogą się nie zmieniać, takie jak współrzędne geograficzne. A zatem tak, patenty się zmieniają, podobnie jak procesy, które za nimi stoją. Interesujące jest znalezienie patentu kontynuacji i próba zrozumienia, co mogło się zmienić.