Как Google может использовать обзоры, чтобы узнать об атрибутах сущностей
Опубликовано: 2018-09-06
Об атрибутах сущности
Когда мы видим, как Google говорит о свойствах различных сущностей, они часто называют их атрибутами сущностей и часто определяют их в парах ключ / значение. Например, рост Авраама Линкольна 6 футов 4 дюйма. Alphabet - холдинговая компания со штаб-квартирой в Маунтин-Вью, Калифорния. У Пола Ньюмана голубые глаза. Fortnite - многопользовательская игра.
Некоторые онлайн-обзоры специально посвящены таким лицам, как продукты, создатели продуктов и / или поставщики продуктов. Эти обзоры могут содержать информацию о тех атрибутах сущностей, которые могут быть интересны поисковикам. Патент, выданный Google на прошлой неделе, сообщает нам, что он может собирать информацию об атрибутах сущностей из обзоров, которые могут быть интересны поисковикам, и как они могут это делать. Это важно, потому что, как сообщает нам патент:
Эти типы пользовательских обзоров могут включать информацию об объектах, которые, возможно, не были предоставлены или сгенерированы, например, самими объектами.
Информация об атрибутах сущностей переходит из обзоров в индекс Google
Этот процесс, связанный с атрибутами сущности, может включать:
(1) Выявление на основе совокупности пользовательских запросов одной или нескольких категорий наблюдаемых интересов пользователей;
(2) обнаружение в одном или нескольких пользовательских обзорах, связанных с продуктом, одного или нескольких сегментов текста, относящихся к одной или нескольким категориям наблюдаемых интересов пользователей;
(3) И на основе обнаружения, индексации в базе данных с возможностью поиска продукт по одной или нескольким категориям наблюдаемых интересов пользователей.
Так. поисковая система может смотреть на запросы об объекте, чтобы определить, что может быть интересно поисковикам в этих объектах, и использовать эти запросы для идентификации текста в обзорах, который может быть интересен поисковикам, и индексировать этот текст, чтобы поисковики могли найти ответы на запросы, которые у них есть о таких объектах, как продукты, производители продуктов и поставщики продуктов.
Google может подсчитать количество запросов, касающихся определенных атрибутов сущности, чтобы понять, насколько интересны ответы на эти запросы, или каков может быть интерес пользователей к ним.
Машинное обучение может использоваться для определения того, интересуют ли запросы сам продукт или производителя продукта.
Соответствующий патент на атрибуты сущности, выданный на прошлой неделе, можно найти по адресу:
Анализ отзывов пользователей для определения атрибутов сущности
Изобретатели: Адвай Менгл, Джиндонг Чен, Чармейн Синтия Роуз Д'Сильва и Анна Паттерсон.
Цессионарий: GOOGLE LLC
Патент США: 10,061,767.
Выдано: 28 августа 2018 г.
Подана: 16 июня 2017 г.
Абстрактный
В данном документе описаны способы и устройство для классификации обзоров пользователей или их частей как относящихся к различным объектам и для связывания извлеченных описательных сегментов текста, содержащихся в этих обзорах пользователей или их частях, с объектами на основе классификаций. В различных реализациях одна или несколько категорий наблюдаемых интересов пользователей могут быть идентифицированы на основе совокупности пользовательских запросов. Один или несколько сегментов текста, относящихся к одной или нескольким категориям наблюдаемых интересов пользователей, могут быть обнаружены в одном или нескольких пользовательских обзорах, связанных с продуктом. На основе обнаружения продукт может быть проиндексирован по одной или нескольким категориям наблюдаемых пользовательских интересов в базе данных с возможностью поиска. В некоторых реализациях доступная для поиска база данных может быть доступна для одного или нескольких удаленных клиентских устройств и может быть доступной для поиска по одной или нескольким категориям наблюдаемого интереса пользователя для предоставления результатов поиска, которые будут отображаться одним или несколькими удаленными клиентскими устройствами.
Отзывы пользователей, как описано в этом патенте, могут быть из таких источников, как:
- блоги
- публикации в социальных сетях
- электронные письма
- статьи, написанные для веб-сайтов или для печатных изданий, таких как журналы или газеты
- публикации, сделанные в разделе отзывов пользователей онлайн-продавца или торговой площадки
- обзоры пользователей, представленные в различные существующие информационные центры для обзоров пользователей
Эти обзоры затем могут быть классифицированы на основе категорий интересов, которые они могут охватывать, и организаций, к которым они могут относиться. Это интересно, потому что этот патент рассказывает нам о том, как машинное обучение может быть частью процесса, связанного с выполнением этих шагов.

В некоторых реализациях одна или несколько «категорий интересов» в объектах могут использоваться для классификации пользовательских обзоров и / или их частей как связанных с конкретными объектами. Обнаружение слов или фраз в обзоре пользователя, которые соответствуют этим категориям (например, как достаточно похожие), может интерпретироваться как сигналы для классификации обзора пользователя или его части как относящейся к объекту. Категории интереса могут иметь различную форму, например категории прогнозируемого интереса и категории наблюдаемого интереса. В различных реализациях механизм категорий может поддерживать индекс категорий, который может использоваться механизмом классификатора для классификации пользовательских обзоров и / или их частей.
Если вы поклонник онлайн-игр, в патенте есть несколько примеров, посвященных тем, которые описывают, как работает процесс, лежащий в основе патента:
Категории наблюдаемых интересов, напротив, могут определяться, например, механизмом категорий на основе закономерностей, наблюдаемых в активности пользователя, например среди множества (или совокупности) пользовательских запросов. Например, продолжая пример с онлайн-рынком приложений, несколько пользователей могут искать приложения, используя одинаковые или похожие термины или фразы. Если достаточное количество пользователей отправляет запросы, содержащие конкретное слово или фразу (или аналогичные их варианты), то механизм категорий может посчитать эти слова или фразы составляющими категорию наблюдаемого интереса и может соответствующим образом обновить индекс. Таким образом, если достаточное количество пользователей будет искать на онлайн-рынке «многопользовательские онлайновые ролевые игры» или «MMORPG», может быть создана категория MMORPG.
Также описаны процессы, связанные с извлечением текста из отзывов, и включают такие вещи, как сравнение между различными объектами (например, «Продукт X лучше, чем продукт Y»).
В патенте уделяется много внимания тому, как информация и конкретные слова и фразы могут быть извлечены из обзоров, и как реагировать на запросы, например, если было много запросов о «камерах с большими возможностями оптического масштабирования», информация могла бы быть быть извлеченным, который ответил на этот запрос для конкретной камеры. И такого рода информацию можно почерпнуть из отзывов пользователей о камерах.
Нам дается подсказка о последствиях таких извлечений:
Механизм графа может выполнять различные действия с этими вновь связанными атрибутами объекта и / или оценками. Например, в некоторых реализациях графическая машина может взаимодействовать с поисковой машиной (не изображена) и может индексировать один или несколько объектов на основе одного или нескольких описательных сегментов текста, которые связаны с этими одним или несколькими объектами, например, с помощью описательного текста. ассоциативный двигатель.
Использование обзоров для получения информации об атрибутах сущностей
Интересно, что Google может использовать пользовательский контент, например обзоры продуктов, чтобы узнать об этих продуктах, производителях этих продуктов и их дистрибьюторах.
Мы видели, что Google проявлял интерес к обзорам продуктов, предприятий и мест, потому что искатели искали эти вещи. Мы также видели, как Google рассказывал о том, как они могут использовать отзывы, чтобы узнать об отношении к объектам. Этот патент продвигает этот интерес на шаг вперед, помимо предоставления пользователям доступа к обзорам или указанию предложений, наполненных сантиментами. Он стремится узнать об объектах обзора, чтобы сопоставить конкретные интересы с информацией, которая на них отвечает.
Патент сообщает нам о том, где можно найти обзоры в Интернете, как можно классифицировать и извлекать текст из этих обзоров, как можно привлечь внимание к запросам искателей, чтобы понять, что эти искатели могут быть заинтересованы в изучении, и что поисковая система может показывать искателям информация о конкретных атрибутах сущности, отвечающая этим интересам.
Возможно, обзоры - хорошее место для получения информации об атрибутах сущностей, которые сами эти сущности не передают. Что вы думаете?
