Оценки связанных объектов в поисках, основанных на знаниях
Опубликовано: 2018-02-12«Идеальная поисковая система точно поймет, что вы имеете в виду, и вернет вам, что именно
вы хотите." Ларри Пейдж, Как работает поиск
Использование баз знаний для ответов на запросы о сущностях
Три года назад я написал «Как сущности базы знаний можно использовать в поиске» о том, как можно выполнять поиск, используя такой запрос, как: «В каком фильме Роберт Дюваль играет персонажа, который говорит, что ему нравится запах напалма по утрам. . » Этот поиск фильма, в котором известный актер говорит, что известная фраза является примером того, как Google использует факты, которые он может узнать из баз знаний, чтобы отвечать на запросы. Он не отвечает с помощью избранного фрагмента. Вместо этого он показывает пару видеороликов, за которыми следуют другие документы, также отвечающие на этот вопрос.
Патент, выданный Google в прошлом месяце, также рассматривает информацию из графа знаний, которую он, возможно, извлек из баз знаний, чтобы отвечать на запросы. Не как избранные фрагменты, а скорее результаты поиска, которые узнают о сущностях в запросе и связанных свойствах. Это семантический поиск, который выходит за рамки понимания синонимов и семантически связанных слов, чтобы знать некоторые свойства вещей, участвующих в поиске (помните, сеть знаний Google посвящена «вещам, а не строкам», поэтому он выходит за рамки простого сопоставления ключевых слов. от запроса к тем же (или связанным) ключевым словам в документе, а также вводит понятие оценки связанных сущностей.
Сеть знаний собирает информацию об объектах для ответов на запросы
Да, граф знаний похож на энциклопедию, но он существует не для этого. Он пытается узнать об объектах, чтобы помочь в ответах на запросы о них в результатах поиска.
Этот новый патент сообщает нам, как он может использовать информацию о конкретных объектах для ответа на запросы:
В некоторых реализациях реализованный на компьютере способ включает идентификацию в графе знаний с использованием по меньшей мере одного процессора, по меньшей мере, одного объекта и связанных объектов, связанных с по меньшей мере одним объектом посредством соответствующих свойств. Реализуемый на компьютере способ содержит для каждого соответствующего одного из связанных объектов определение с использованием по меньшей мере одного процессора оценки связанного объекта, ассоциированного с соответствующим свойством, которое связывает по меньшей мере один объект и соответствующий один из связанных объектов. Реализуемый компьютером способ содержит для каждого соответствующего свойства создание оценки свойства с использованием по меньшей мере одного процессора на основе оценок связанных объектов, связанных с этим соответствующим свойством. Реализуемый компьютером способ включает создание, использование по меньшей мере одного процессора и обеспечение сохранения структуры данных сортируемых свойств на основе сгенерированных оценок свойств, при этом структура данных используется для предоставления отсортированных результатов поиска в ответ на запрос.
Если вы зададите Google вопрос вроде «Где был геодезистом Джордж Вашингтон?» поисковая машина предоставляет результаты поиска, в которых подробно описывается, где он работал геодезистом-подростком до того, как пошел в армию.

Город под названием Вашингтон Вирджиния (который называет первым Вашингтоном) посвящен памяти 17-летнего парня, который исследовал окрестности в молодые годы.

Оценки связанных организаций
Как работает процесс этого патента? Вот как работает граф знаний, помогая возвращать результаты поиска с использованием оценок связанных сущностей:
В некоторых реализациях система содержит структуру данных, содержащую граф знаний и один или несколько процессоров. Один или несколько процессоров сконфигурированы для выполнения операций, включающих идентификацию в графе знаний по меньшей мере одного объекта и связанных объектов, связанных по меньшей мере с одним объектом посредством соответствующих свойств. Один или несколько процессоров сконфигурированы для выполнения операций, содержащих для каждого соответствующего одного из связанных объектов определение оценки связанного объекта, связанной с соответствующим свойством, которое связывает по меньшей мере один объект и соответствующий один из связанных объектов. Один или несколько процессоров сконфигурированы для выполнения операций, содержащих для каждого соответствующего свойства создание оценки свойства на основе оценок связанных объектов, связанных с этим соответствующим свойством. Один или несколько процессоров сконфигурированы для выполнения операций, включающих создание и сохранение структуры данных сортируемых свойств на основе сгенерированных оценок свойств, при этом структура данных используется для предоставления отсортированных результатов поиска в ответ на запрос.
Недавно выданный патент
Предоставление результатов поиска на основе отсортированных свойств
Изобретатели: Имин Ли и Чжэньюй Гу.
Цессионарий: Google LLC
Патент США 9875320
Выдано: 23 января 2018 г.
Подана: 8 февраля 2016 г.
Абстрактный
Сущность может быть связана с несколькими связанными сущностями одним или несколькими свойствами, и сущность также может быть связана с одним или несколькими типами сущностей. Система предоставления отсортированных результатов может включать в себя идентификацию сущности, связанных сущностей и типов. Система также может определять оценки связанных объектов для каждого соответствующего связанного объекта относительно объекта. Для каждого свойства оценки связанных сущностей связанных сущностей, связанных с сущностью этим свойством, объединяются для создания оценки свойства. Затем свойства сортируются на основе их оценок. Сортировка может происходить для свойств, связанных с типом объекта, и отсортированные результаты поиска могут предоставляться как выходные данные для одного или нескольких типов объектов, представляющих интерес.
Результаты поиска и избранные фрагменты
Мы видели ответы на некоторые запросы, которые предоставляют комбинацию результатов поиска и избранных фрагментов, как я писал в посте. Собирается ли Google объединить свою базу знаний со своей поисковой системой? Google не проявляет особого предпочтения при ответе на запрос с помощью результата поиска, избранного или структурированного сниппета.
Иногда ответ на вопрос о фильме может показаться очень подходящим. Мне нравится, когда возникает вопрос о географии, например, какая столица ХХХХ? показывает карту в избранном фрагменте, потому что расположение столицы может быть полезной информацией.
Нет специальных баз знаний о том, как Google использует свою сеть знаний для ответов на вопросы о сущностях
Пока нет баз знаний, которые рассказывали бы нам, как Google использует граф знаний. Ближайшие из имеющихся у нас - это патенты, подобные этому, в которых содержится значительный объем информации. Этот раздел был богат концепциями и намеками на то, как Google может обрабатывать информацию о свойствах:

Конкретный объект может быть связан с несколькими типами, а также может быть связан с несколькими другими объектами одним или несколькими свойствами. В данном контексте сущность - это вещь или понятие, которое является единичным, уникальным, четко определенным и различимым. Например, сущность может быть человеком, местом, предметом, идеей, темой, абстрактным понятием, конкретным элементом, другой подходящей вещью или любой их комбинацией. В некоторых реализациях результаты поиска включают результаты идентификации ссылок на сущности. В данном контексте ссылка на объект - это идентификатор, например текст или другая информация, которая относится к объекту. Например, сущность может быть физическим воплощением Джорджа Вашингтона, а ссылка на сущность - это абстрактное понятие, относящееся к Джорджу Вашингтону. Где это уместно, на основе контекста, будет понятно, что термин «объект», используемый в данном документе, может соответствовать ссылке на объект, а термин «ссылка на объект», используемый в данном документе, может соответствовать объекту. В некоторых реализациях поисковая система может идентифицировать тип объекта, связанный со ссылкой на объект. Тип объекта может быть категоризацией или классификацией, используемой для идентификации ссылок на объекты в структуре данных. Например, ссылка на сущность «Джордж Вашингтон» может быть связана с типами сущностей «Президент США», «Лицо» и «Военный офицер». Свойства описывают отношения между сущностями, другими словами, как одна сущность связана с другой сущностью. Наиболее важные свойства, связанные с сущностью, могут зависеть от того, какие из ее типов представляют интерес. Например, для объекта «Том Хэнкс» пользователь может захотеть, чтобы результаты поиска включали его фильмы или другую информацию о его действиях. Однако для объекта «Альберт Эйнштейн» пользователи могут захотеть, чтобы результаты поиска включали его теории, технические статьи и другую информацию, связанную с его вкладом в физику. Раскрытые методы могут быть использованы для определения важных атрибутов и, соответственно, для предоставления результатов поиска, которые, вероятно, будут нужны пользователю.
Хотите узнать больше о том, как можно использовать базу знаний в семантическом поиске? Возможно, вам стоит прочитать этот патент. Имейте в виду, что Google считает многие сайты полезными базами знаний, выходящими за рамки Википедии и Викиданных. Он может рассматривать такие источники, как IMDB и Yahoo Finance, как полезную информацию о фактах.
Чтобы проиллюстрировать этот патент, я решил показать Джорджа Вашингтона в качестве геодезиста. Не многие знают, что он делал это в подростковом возрасте! Также возможно, что эта должность сыграла значительную роль на должностях, которые он занимал позже, как военачальник и политик. Следующий отрывок из патента о типах сущностей и понимании информации в графике повлиял на мою иллюстрацию выбора:
Узел, представляющий данные организации, может быть включен в граф знаний. В данном документе они могут упоминаться как узлы типа объекта. Как используется здесь, узел типа объекта может относиться к узлу в графе знаний, в то время как тип объекта может относиться к концепции, представленной узлом типа объекта. Тип объекта может быть определяющей характеристикой объекта. Например, узел типа сущности Y может быть соединен с узлом сущности X ребром или связью «Is A», что дополнительно обсуждается ниже, так что граф представляет информацию «Сущность X является типом Y». Например, узел сущности «Джордж Вашингтон» может быть связан с узлом типа сущности «Президент». Узел объекта может быть подключен к нескольким узлам типа объекта, например, «Джордж Вашингтон» также может быть подключен к узлу типа объекта «Человек» и к узлу типа объекта «Военный командир».
Я рекомендую прочитать этот патент и попытаться понять его. Это может помочь понять, как поисковая система может захватывать и возвращать запросы о свойствах и их различных аспектах. Это гораздо более семантический поиск, учитывающий информацию о вещах и о том, как они могут быть связаны друг с другом. Речь идет не о сопоставлении строк текста из запросов с документами. Скорее сосредоточьтесь на знании сущностей, их типов, их свойств и того, как они могут быть связаны с другими сущностями.
Я бы хотел посмотреть фильм о молодом Вашингтоне, исследующем холмы Вирджинии. Я спросил в Google: «Есть ли фильм про Джорджа Вашингтона как геодезиста?» Похоже, что анимационный фильм начался с рассказа о тех днях: генерал Джордж Вашингтон.
Будем ли мы использовать оценки связанных объектов и оценки собственности при создании контента в будущем?
Будут ли оценки связанных организаций и имущества важными вещами, которые следует учитывать в будущем? Патент дает подсказки, как поисковые системы могут использовать их следующим образом:
Этап 606 включает в себя один или несколько процессоров, генерирующих оценку свойства для каждого свойства на основе оценок связанных объектов, связанных с этим свойством. Оценки связанных объектов, связанные с каждым конкретным свойством, могут быть объединены для этого свойства. Например, ссылаясь на фиг. 4, оценки связанных объектов для связанных объектов «Форрест Гамп», «Большой» и «Спасти рядового Райана» могут быть суммированы, чтобы получить сумму для свойства «Фильмы, в которых снимались фильмы», например 0,8 + 0,8 + 0,8 = 2,4. В дополнительном примере оценки связанных объектов могут быть объединены в виде взвешенной суммы. Любая подходящая комбинация оценок связанных объектов может использоваться для создания оценки свойства. В некоторых реализациях один или несколько типов могут быть подтипом другого типа сущности. Например, ссылка на структуру 550 данных на фиг. 5, тип «Актер» может быть подтипом типа сущности «Лицо», который может упоминаться как родительский тип по отношению к подтипу. В некоторых таких реализациях для родительского типа оценка свойства для каждого свойства каждого подтипа может быть суммирована с тем же свойством родительского типа. Например, ссылка на структуру 550 данных на фиг. 5, свойство «Фильмы, в которых выполнялись действия» включено в тип «Актер» и «Человек», и, соответственно, оценка свойства 9,0 для типа сущности «Актер» может быть агрегирована с оценкой свойства 1,0 для типа сущности «Человек». ” Один или несколько процессоров могут перенормировать, масштабировать, весить или иным образом изменять оценки в родительском типе после включения подтипа.
После прочтения это может иметь немного больше смысла. Google использует свою графу знаний, чтобы отвечать на поисковые запросы с результатами поиска как минимум 3 года. Они тоже становятся более изощренными. Вероятно, он продолжит развиваться, поскольку Google пробует новые вещи и больше экспериментирует с тем, как они отображают результаты поиска.
