Google показывает нам, что контекст является королем при индексировании людей

Опубликовано: 2017-12-12

Контекст - это король

Иногда вы увидите, как кто-то, пишущий о SEO, говорит, что «контент - король». Но когда я это вижу, у меня часто возникает соблазн ответить: «Контекст - это король».

Правильные слова в нужное время, отвечающие намерениям ищущего, могут удовлетворить их информационные или даже ситуативные потребности. Когда вы пишете страницу, вы должны включать слова, которые могут помочь продемонстрировать контекст ключевых слов, на которых вы можете сосредоточиться во время ее создания.

Больше патентов на контекст

Недавно я заметил, что патенты, поступающие от Google, сосредоточены на контексте. Одним из первых был патент на контекстные векторы. Я написал об этих векторах контекста в посте: «Векторы контекста патентов Google для улучшения поиска».

В сообщении «Доставляет ли завтра тематические результаты поиска в Google?» Я писал о патенте Google, в котором говорилось, что поисковые системы могут начать показывать хлебные крошки перед каждым результатом поиска, что может показать значение термина запроса, который может иметь более одного значения. .

Заметив, что Google уделяет больше внимания контексту при индексировании страниц и отображении страниц в результатах поиска, мое внимание привлекло слово «контекст» в недавнем патенте Google. Особенно, когда я увидел «Устранение неоднозначности имен с использованием контекстных терминов», о котором я пишу сегодня.

Рассмотрим обычное имя, такое как Джон Смит. Есть хорошо известный Джон Смит из Англии, который известен тем, что открыл колонию Джеймстаун, первое постоянное английское поселение в Северной Америке. Есть еще один Джон Смит, известный как ботаник. Этот патент сообщает нам, что он может идентифицировать некоторые термины из контекстного словаря, которые могут быть связаны с каждым Джоном Смитом. Итак, если кто-то ищет сады Джона Смита и Кью, они, скорее всего, ищут ботаника. Другой человек, ищущий Джона Смита и Вирджинию, вероятно, ищет исследователя.

Этот патент идентифицирует проблему, которую он стремится решить, на аналогичных примерах:

Очень популярный сценарий поиска - поиск по личным именам. Поскольку имена большинства людей не уникальны, первоначальный поиск по имени человека может дать несколько результатов поиска, каждый из которых ссылается на ресурсы, описывающие разных людей. Например, поиск по имени «Джон Смит» может дать результаты поиска, содержащие ссылки на ресурсы с информацией об исследователе, ресурсы о ботанике и кураторе Кью-Гарденс, ресурсы о профессиональном рестлере и другие ресурсы о других людях, которые названы «Джон Смит». Поскольку поисковые запросы часто являются неполным выражением необходимой информации, пользователь часто пересматривает поисковый запрос, чтобы сосредоточиться на результатах поиска. Такие изменения, включая добавление дополнительных условий поиска к имени. Например, предположим, что пользователь ищет информацию, касающуюся взаимодействия исследователя Джона Смита с Шефом Поухатаном. Пользователь может изменить запрос, чтобы он читался как «Джон Смит Чиф Поухатан». Поисковый запрос заставит поисковую систему предоставлять результаты поиска, которые ссылаются на документы, которые с большей вероятностью удовлетворят информационные потребности пользователя.

Когда в Википедии есть запись о более чем одном человеке с одним и тем же именем, она содержит информацию о «разрешении неоднозначности». Помимо имени человека, он может содержать другие термины, позволяющие определить, к какому человеку идет обращение. В случае с Джоном Смитсом, о котором я пишу, это может быть:

Джон Смит (ботаник)
Джон Смит (исследователь)

Эти репрезентативные термины могут быть взяты из поисковых предложений:

Термины запроса и репрезентативные термины могут выглядеть как термины разрешения неоднозначности, найденные в Википедии:

Предложения по устранению неоднозначности из Википедии

В патенте не упоминается, что мы можем видеть панели знаний, которые идентифицируют каждого из этих разных Джонов Смита:

Джон Смит (исследователь):

Джон Смит (ботаник):

Как Google отслеживает различных Джонов Смитов?

1. Списки контекстных терминов создаются для имен людей:

… Каждый список контекстных терминов представляет собой список контекстных терминов из ресурса для имени человека, и каждый из ресурсов, которым соответствуют списки контекстных терминов для имени человека, является разными ресурсами; кластеризацию списков контекстных терминов во множество кластеров, причем каждый из кластеров списков контекстных терминов включает в себя списки контекстных терминов, которые наиболее похожи на кластер по сравнению с другими кластерами; для каждого из кластеров выбор репрезентативного термина для кластера; получение имени человека в качестве поискового запроса; и генерируют множество предложений запроса из поискового запроса и репрезентативных терминов для кластеров, причем каждый запрос предлагает комбинацию имени человека и одного репрезентативного термина.

2. Преимущества контекстного подхода согласно патенту:

Пользователям предоставляются варианты запросов для личных имен, и каждое предложение является представителем контекста, связанного с именем. Каждый контекст используется для устранения неоднозначности имени, и, таким образом, пользователь может быстро сфокусировать поиск на соответствующем контексте без необходимости вручную определять различные контексты. Имена лиц, которые иначе имели бы доминирующую интерпретацию (например, имена известных людей или исторических личностей), устраняются среди контекстов, а доминирующая интерпретация ограничивается надлежащим подмножеством контекстов. Соответственно, система может предоставлять предложения запроса для доминирующей интерпретации и множества других контекстов, которые не связаны с доминирующей интерпретацией.

3. Ресурсы, которые относятся к одному и тому же человеку (то есть имя, неоднозначное в контексте), могут быть сгруппированы отдельно.

Другие термины, которые могут иметь более одного значения, например Jaguar, могут иметь результаты, сгруппированные по отдельности. Например, автомобиль Jaguar, кот-Jaguar и футболисты Jacksonville Jaguar NFL.

Патент контекста

Патент о контексте и именах можно найти по адресу:

Устранение неоднозначности имени с использованием контекстных терминов
Изобретатели: Нитин Гупта и Абхинандан С. Дас
Цессионарий: Google Inc.
Патент США: 9,830,379.
Выдано: 28 ноября 2017 г.
Подана: 29 ноября 2010 г.

Абстрактный

Способы, системы и устройства, включая компьютерные программы, закодированные на компьютерном носителе данных, для устранения неоднозначности имен в корпусе документов. В одном аспекте способ включает в себя создание списков контекстных терминов для имени человека, каждый список контекстных терминов представляет собой список контекстных терминов из ресурса для имени человека; кластеризацию списков контекстных терминов во множество кластеров, причем каждый из кластеров списков контекстных терминов включает в себя списки контекстных терминов, которые наиболее похожи на кластер по сравнению с другими кластерами; для каждого из кластеров выбор репрезентативного термина для кластера; получение имени человека в качестве поискового запроса; и генерируют множество предложений запроса из поискового запроса и репрезентативных терминов для кластеров, причем каждый запрос предлагает комбинацию имени человека и одного репрезентативного термина.

Выводы

Как и в патенте на контекстные векторы, базы знаний могут помочь найти информацию о потенциально уникальных людях. Например, Майкл Джексон был известным популярным певцом. Еще был Майкл Джексон, который был администратором Министерства внутренней безопасности. Мы можем узнать это из страницы Майкла Джексона (значения). Точно так же, как мы можем найти различные типы лошадей для всадников, плотников и гимнастов. Можно использовать термины, которые помогают определить контекст для каждого из этих значений и лиц.

Этот патент на устранение неоднозначности говорит нам, что запросы, используемые для поиска страниц, могут показывать нам различные контексты, связанные с именами людей. Если вы оптимизируете страницу для конкретного человека, имеет смысл включить контекстные термины, которые помогут определить, о ком вы пишете.

Если возможно использовать термины, которые помогают определить контекст для человека, в том числе те термины на страницах, которые вы создаете о нем, могут помочь в индексации нужного человека, обращая внимание на контекст.