Как Google может прогнозировать намерение запроса, используя контекстные истории
Опубликовано: 2018-11-29Понимание цели запроса, лежащего в основе поисков
Таксономия веб-поиска (pdf) Андреа Бродер описывает различия между информационными, транзакционными и навигационными запросами. Об этом полезно знать при оптимизации страниц для условий запроса.
Вы собираетесь учить людей концепции или теме? Если да, то вы относитесь к их запросу как к информационному.
Вы создаете страницу, предназначенную для продажи товаров или услуг? Затем вы обрабатываете их запрос, как если бы он был транзакционным, и позволяете им что-то купить или что-то забронировать.
Запрос, используемый, чтобы помочь кому-то найти страницу, о которой они знают, потому что они видели ее раньше или ожидают, что она существует, и они ожидают, что конкретная страница, возвращенная им, называется навигационным запросом. Когда кто-то ищет название определенного продукта или бренда, его устраивает домашняя страница этого продукта или бренда.
Сайт, на котором я начал заниматься поисковой оптимизацией в качестве внутреннего SEO-специалиста, помог людям объединить компании. Эта страница получила хороший рейтинг по таким терминам, как «инкорпорировать в Делавэре». Он получил больше конверсий, когда он был вторым по рейтингу сайтом за этот период после веб-сайта Делавэрского подразделения корпораций, который был исключительно информационным сайтом, который не предлагал посетителям возможности зарегистрировать свой бизнес в Делавэре.
Люди увидят сайт Отдела корпораций в результатах поиска, посетят его и узнают о процессе, а затем вернутся к результатам поиска и посетят сайты транзакций, такие как мой, где они могли бы подключиться. Это был случай, когда сайт с самым высоким рейтингом не был преимуществом. Понимание цели таких запросов помогает объяснить, почему это произошло.
Подробнее о намерении запроса
Еще один документ о целях поиска и запросов - это простая модель классификации.
Веб-запросы по намерениям пользователя (pdf): Д. Иразу Эрнандес, Парт Гупта, Паоло Россо и Марта Роша. Он делает некоторые интересные утверждения о намерениях запроса, которые стоит повторить, в том числе это:
Классификация запросов, основанная на намерениях пользователя, направлена на классификацию запросов о необходимости, стоящей за запросами. Янсен и Бут [4] определяют намерение пользователя как выражение эмоциональной, когнитивной или ситуативной цели при взаимодействии с поисковой системой в Интернете. Классификация запросов, основанная на намерениях пользователя, отличается от традиционной классификации текстов в основном по двум причинам [2]: во-первых, веб-запросы обычно очень короткие; во-вторых, многие запросы неоднозначны, и часто запрос принадлежит нескольким категориям. Например, по запросу «билеты в оперный театр» трудно определить, хочет ли пользователь узнать веб-сайт или купить билеты для посещения мероприятия. Большая часть усилий обычно связана с небольшим количеством запросов, классифицируемых вручную.
Хотя в этом документе представлены некоторые идеи и подходы к лучшему пониманию цели запроса, мне понравилось, как в нем сформулирована проблема, которую он стремился решить. Патентная заявка от Google, опубликованная на прошлой неделе, описывает, как поисковая система может попытаться понять контекст поиска, чтобы лучше понять намерения поисковика, стоящего за их запросами.
Патент Google на прогнозирование намерения запроса на основе контекста
Это не новая концепция: мы можем связать намерение с запросом, и что Google может попытаться сделать это, чтобы понять, что человек ищет, когда затем набирает несколько слов в поле поиска. Что действительно кажется новым в этом патенте, так это то, сколько усилий может приложить Google, чтобы попытаться понять цель запроса. Когда кто-то вводит слово «пицца» в Google в обеденное время, мы можем предположить, что он может быть заинтересован в еде и, возможно, ищет место, где можно либо забрать пиццу, либо доставить им.
Вероятность того, что они ищут историю пиццы на протяжении всего времени, менее вероятно (но они могли бы быть). Сколько контекста может потребоваться, чтобы сделать такие предположения правильными для большинства поисков?
Как и большинство патентов, этот новый патент от Google рассказывает нам о проблеме, которую он призван решить:
Если поисковый запрос не является узкоспециализированным или если пользователь не предоставляет много дополнительной информации помимо запроса, вычислительное устройство может вернуть слишком много информации; при этом пользователю сложно найти часть наиболее интересной или актуальной информации. Пользователь может испытывать стресс и / или тратить драгоценное время и ресурсы на ввод очень подробных запросов в вычислительное устройство, заставляя вычислительное устройство выполнять несколько поисков или просеивая большое количество результатов поиска, чтобы получить информацию, необходимую для выполнения определенной задачи. .
Если этот поисковик голоден и быстро хочет немного пиццы, его удовлетворенность поисковой системой может быстро возрасти, если она сможет определить ближайшее место, где можно доставить вкусную пиццу.
Использование контекста для прогнозирования намерения запроса

Намерение запроса может использоваться, чтобы позволить поисковой машине настраивать результаты поиска, возвращаемые в результате поиска, так, чтобы информация для удовлетворения намерения была подчеркнута над другой информацией, возвращаемой в результате поиска.
Патент дает нам пример того, как кто-то ищет фильм, на который они только что купили билеты. Система может иметь возможность просматривать данные журнала и определять, что искатель уже купил билеты на будущий показ этого фильма, и может корректировать результаты таким образом, чтобы «расписание сеансов фильмов оценивалось ниже, чем другая информация (например, обзоры, памятные вещи. , мелочи и т. д.) о конкретном фильме ».
Мы знакомы с поисковой системой, собирающей информацию о предыдущих поисках, которые мы выполняли для персонализации результатов, которые мы могли бы увидеть, но это использование контекста, направленное на снижение стресса или избежание потери времени, отличается.
Патентная заявка сообщает нам, что она может просматривать такую контекстную информацию только после получения разрешения от лица, использующего поисковую систему, для анализа этой информации. Патент предоставляет дополнительные примеры того, как они могут использовать контекстную информацию, которая может изменить порядок результатов поиска, которые они могут показывать искателю.
Имейте в виду, что это все еще находящаяся на рассмотрении заявка на патент, и она, вероятно, еще не была реализована, но может быть на каком-то этапе в будущем, и что вполне вероятно, что Google обращает внимание на контекст, чтобы предсказать цель запросов, и уже могут использовать такие вещи, как время суток, день года и местоположение.

Патент действительно говорит нам, что он ограничивает использование некоторой информации, например любой, которая может раскрыть личную информацию о поисковике.
Эту недавно опубликованную патентную заявку можно найти по адресу:
Предсказание намерения поиска для определенного контекста
Номер публикации: 20180336200
Дата публикации: 22 ноября 2018 г.
Претенденты: Google Inc.
Изобретатели: Ю Джин Лим, Джозеф Линн, Юлин Лян, Карстен Штайнебах, Вэй Люн Лу, Дон Хён Ким, Джеймс Кун, Лорен Кёпник и Мин Ян
Абстрактный:
Описывается вычислительная система, которая определяет на основе действий, инициированных пользователем, выполняемых группой вычислительных устройств, и цель поиска с использованием конкретного поискового запроса, полученного от вычислительного устройства. Вычислительная система корректирует на основе намерения, по меньшей мере, определенную часть результатов поиска, полученных в результате поиска с использованием поискового запроса, путем выделения информации, которая удовлетворяет намерению. Вычислительная система отправляет на вычислительное устройство указание скорректированных результатов поиска.
Примеры контекстной истории
В патентной заявке рассказывается о некоторых различных типах контекстной информации, которая может использоваться для прогнозирования намерений запроса, включая список вещей, которые они называют интересными темами, которые можно найти, посмотрев на такие вещи, как:
- График интересов пользователей или какой-либо другой тип структуры данных
- Контактная информация, связанная с пользователями (например, личная контактная информация пользователя, а также информация о друзьях пользователя, коллегах, связях в социальных сетях, семье и т. Д.)
- Истории поиска
- Истории местоположений
- Долгосрочные и краткосрочные задачи
- Информация календаря
- Истории использования приложений
- История покупок
- Избранное
- Закладки
- Другая информация
В дополнение к этим личным интересам они включают другую контекстную информацию.
По поводу рабочего состояния вычислительного устройства (а здесь копают глубоко):
- Положения переключателей
- Уровни заряда батареи
- Подключено ли устройство к розетке или иным образом подключено к другому устройству и / или машине.
- Информация об аутентификации пользователя (например, какой пользователь в настоящее время аутентифицирован или является текущим пользователем устройства)
- Работает ли устройство в режиме «в самолете», в режиме ожидания, в режиме полной мощности.
Другие примеры контекстной информации:
- Акустический отпечаток пальца
- Отпечаток видео
- Местоположение
- Траектория движения
- Направление
- Скорость
- Название заведения
- Почтовый адрес
- Тип места
- Здание
- Погодные условия
- Условия дорожного движения
- Календарное событие
- Встреча или другое событие, связанное с местом и / или временем
- Адрес веб-страницы, просматриваемой в определенное время.
- Одна или несколько текстовых записей, сделанных в полях данных веб-страниц в определенное время, включая историю поиска или просмотра.
- покупки продуктов, сделанные в определенное время
- списки желаний продуктов
- Реестры продуктов
- Аудио и / или видео, к которым осуществляется доступ или которые транслируются в присутствии вычислительного устройства в различных местах и в разное время
- Телевидение или кабельное / спутниковое вещание, к которому осуществляется доступ или которые транслируются в присутствии вычислительного устройства в различных местах и в разное время
- Информация о других услугах, к которым компьютерное устройство обращается в разное время и в разных местах.
Мы видим другие типы информации, появляющиеся в этом патенте, например историю местоположений мобильных устройств, о которой я подробно писал ранее.
Патентная заявка сообщает нам о том, как она может индексировать такие контексты, чтобы иметь возможность искать информацию, которая может иметь отношение к запросу, что может привести к дополнению или изменению результатов поиска такого запроса.
Он также сообщает нам, что он может поддерживать историю поиска отдельно от контекстной истории, которую поисковая система может вести о поисках и устройствах, на которых выполняется поиск. Google не может допрашивать пользователя об их намерениях, связанных с поиском, но похоже, что они могут много узнать о людях и машинах, стоящих за поиском, чтобы дать им возможность предугадывать, что показывать в результатах поиска.
Машинное обучение для определения намерения запроса
Патент Google сообщает нам, что процесс включает в себя сбор большого количества информации. Он может делать прогнозы после фильтрации ненужной информации, чтобы «определить узкий контекст, чтобы можно было вывести истинное намерение поискового запроса».
Патент рассказывает нам о том, как можно использовать глубокое обучение для решения этой задачи:
Модуль прогнозирования может выполнять модель машинного обучения (например, модель глубокого обучения), которая получает в качестве входных данных: поисковый запрос (или часть поискового запроса) и текущий контекст, полученный из контекстного модуля. Модель машинного обучения может генерировать в качестве вывода указание (например, метку или другой идентификатор) намерения поиска с использованием поискового запроса для текущего контекста.
Вывод
Патент предоставляет подробную информацию о предопределенных намерениях (например, о поездках) и оценках намерений, а также о том, как пользовательские данные могут обучать машинное обучение вовлеченному намерению запроса.
Это патентная заявка, и Google, возможно, не реализовал создание таких контекстных историй и корректировку результатов поиска на их основе. Также имейте в виду, что в патенте говорится, что они, скорее всего, попросят разрешения, прежде чем анализировать такие контекстные данные.
Чтобы повторить намерение запроса на основе примера контекста, который я поделился выше:
- Вы покупаете билеты в кино
- Вы выполняете поиск этого фильма
- Поисковая система замечает вашу историю покупок
- Вместо того, чтобы показывать вам расписание других показов того же фильма, ваши результаты поиска могут быть скорректированы так, чтобы показывать вам мелочи, памятные вещи и новости о фильме.
Хотя Google тщательно отслеживает историю поиска и историю местоположений, такое понимание цели запроса и использование контекстной истории потенциально может изменить ранжирование в гораздо большей степени, чем персонализация поиска.
