Click a Panda: высококачественные результаты поиска на основе повторных кликов и продолжительности посещения

Опубликовано: 2017-06-29

Щелкните Панду

Патент Panda возвращается с новыми требованиями

Три года назад я писал о патенте от Google Navneet Panda, в котором основное внимание уделялось ранжированию страниц в результатах поиска. Мой пост был резюме. и называлась «Панда Google» получила патент на ранжирование результатов поиска. На прошлой неделе Google получила продолжение патента, о котором я писал в этом посте. Мне нравятся продолжающиеся патенты, поскольку раздел формулы изобретения в таких патентах меняется, так как процесс, описанный в них, каким-то образом изменился. Эти изменения часто являются интересным отражением того, что Google вносит изменения в процесс, описанный в исходном патенте. Это указывает на важность повторных кликов.

В последние годы мы видели изменения в Google, связанные с такими вещами, как Rank Brain и Machine Learning, но обновления в этом патенте, похоже, связаны с взаимодействием пользователей с веб-сайтами. Как я уже упоминал, одним из изобретателей, задействованных в этом патенте, является Навнит Панда, который наиболее известен своим участием в обновлении Panda в Google. Неудивительно, что в патенте говорится о понижении качества результатов поиска для страниц низкого качества.

Я посмотрел на формулу этой новой версии патента и был удивлен изменениями в том, как она работает.

Патент ориентирован на результаты поиска, возвращаемые в ответ на запрос. В нем упоминается фактор модификации на основе группы, который может повлиять на то, какие результаты поиска будут отображаться для запроса:

В общем, один инновационный аспект предмета, описанного в этой спецификации, может быть воплощен в способах, которые включают в себя действия по приему поискового запроса от клиентского устройства; прием данных, идентифицирующих множество ресурсов результатов поиска и соответствующие начальные оценки для каждого из ресурсов результатов поиска; идентификацию соответствующей группы ресурсов, которой принадлежит каждый из ресурсов результата поиска; определение соответствующего коэффициента модификации на основе группы для каждой группы ресурсов и корректировка начальной оценки для каждого из ресурсов результата поиска на основе, по меньшей мере, частично, фактора модификации группы для группы ресурсов, к которой принадлежит ресурс результата поиска для генерации соответствующей второй оценки для каждого из ресурсов результатов поиска.

Процесс, лежащий в основе патента

Процесс, описанный в патенте, начинается с определения, является ли результат, выбранный в ответ на запрос, навигационным или нет. Если это так, то описанный в патенте процесс, похоже, не добавляет много информации о сайте, выбранном в результатах поиска.

Патент сообщает нам об уникальных кликах и преднамеренных посещениях (от пользователя, который до этого не нажимал на результаты поиска любого ресурса в определенной группе) и о том, как он может смотреть на количество повторных кликов по конкретной группе ресурсов, выбранных для создания доля повторных кликов для выбранных ресурсов.

Если кто-то в течение более чем одного сеанса поиска выполняет поиск и выбирает один и тот же ресурс (возможно, используя разные слова), это будет считаться повторным щелчком, и чем больше повторных щелчков, тем выше сигнал качества для этого ресурса - если кто-то намеренно возвращается на страницу (преднамеренное посещение), это является положительным знаком и сочетается с другими сигналами, такими как продолжительность их пребывания на этой странице, прежде чем они вернутся к поиску.

Важность продолжительности посещения

Хотя продолжительность посещения результатов поиска - это то, на что я видел намеки как на то, что поисковая система может использовать в качестве положительного сигнала, я впервые вижу, что это четко указано в патенте, который говорит нам:

Средняя метрика продолжительности для конкретной группы ресурсов может быть статистической мерой, вычисляемой из набора данных измерений продолжительности времени, которое проходит между временем, когда данный пользователь нажимает на результат поиска, включенный в веб-страницу результатов поиска, которая идентифицирует ресурс в определенной группе ресурсов и время, когда данный пользователь возвращается на веб-страницу результатов поиска.

Как я писал в статье «Распутывание шаблонов панды» в Moz, признаки высокого качества в результатах поиска являются положительным сигналом, а признаки некачественных ресурсов могут привести к понижению этих ресурсов в результатах поиска. Патент сообщает нам, что преимущества этого метода заключаются в следующем:

Таким образом, взаимодействие с пользователем может быть улучшено, поскольку результаты поиска, расположенные выше в порядке представления, будут лучше соответствовать информационным потребностям пользователя.

Обновленный патент-продолжение:

Ранжирование результатов поиска
Изобретатели: Навнит Панда, Владимир Офицеров, Кайхуа Чжу.
Цессионарий: Google
Патент США: 9,684,697.
Выдано: 20 июня 2017 г.
Подана: 31 декабря 2012 г.

Абстрактный

Способы, системы и устройства, включая компьютерные программы, закодированные на компьютерных носителях данных, для приема поискового запроса от клиентского устройства; прием данных результата поиска, идентифицирующих первое множество ресурсов результатов поиска и соответствующие начальные оценки для каждого из первого множества ресурсов результатов поиска; идентификацию соответствующей группы ресурсов, которой принадлежит каждый из ресурсов результата поиска; определение соответствующего фактора модификации на основе группы для каждой группы ресурсов и корректировка начальной оценки для каждого из ресурсов результата поиска на основе, по меньшей мере частично, фактора модификации группы для группы ресурсов, к которой принадлежит ресурс результата поиска для генерации соответствующей второй оценки для каждого из ресурсов результатов поиска.

Ранняя версия результатов поиска по патенту, выданная в 2014 году, отличается от этой новой версии, особенно в разделе формулы изобретения, в котором клики обсуждаются более подробно.

Take Aways

Многие представители Google говорили нам, что данные о выборе кликов имеют тенденцию быть шумными и не используются для ранжирования результатов поиска, а вместо этого могут использоваться для тестирования алгоритмов, используемых Google. Верно ли то же самое и с этим патентом? Похоже, что это важная часть того, как функционирует процесс, описанный в патенте, и стоит потратить некоторое время на размышление. Патент указывает на клики от пользователей, выполнивших вход в систему, и сопровождается файлами cookie или идентификаторами устройств. Насколько это надежно?

Но что еще более важно: (1) дайте людям повод приходить на ваш веб-сайт из-за того, что вам нужно для ранжирования, и
(2) Дайте людям повод провести время на вашей странице, как только они придут к вам в гости.