Семантический поиск: подробное руководство по пониманию и оптимизации семантического поиска

Опубликовано: 2016-01-27

Оглавление

Что такое семантический поиск и скрытое семантическое индексирование (LSI)

LSI (латентное семантическое индексирование) - это способ, которым поисковые системы определяют, действительно ли ваш контент посвящен теме и является подробным или просто спамом. Поисковые системы определяют это, просматривая слова в статье и решая, насколько они релевантны друг другу. Например, для статьи о компьютерах поисковые системы знают, что следующие слова тесно связаны с «компьютерами» и, вероятно, появятся в любой хорошей статье о компьютерах: жесткий диск, процессор, оперативная память, монитор, материнская плата, ghz, mhz, Intel, Nvidia и т. Д. Они известны как термины LSI.

Итак, вот что происходит, когда поисковая система находит вашу статью:

1. Читает статью

2. Он определяет «плотность ключевых слов» каждого слова или фразы в статье. Это означает, что он просматривает все количество слов в статье и определяет, сколько раз определенные слова или фразы повторяются в статье. Слова и фразы, которые повторяются чаще, имеют более высокую плотность ключевых слов. Так поисковая система узнает, о чем ваша статья. Так что для статьи о «корпусах для настольных ПК» эта фраза может появиться 4 раза в вашей статье из 700 слов. Это даст ему плотность около 1,7%. (12/700 = 1,7%).

Мы используем 12, потому что «чехлы для настольных ПК» состоят из 3 слов, поэтому 3 слова X 4 внешнего вида = 12. Вы можете помочь поисковой системе выяснить, о чем ваша статья, включив ключевое слово в заголовок, первый и последний абзацы. абзац вашей статьи, поскольку поисковые системы знают, что нужно уделять больше внимания этим областям статьи.

3. Он выбирает слова и фразы с наибольшей плотностью ключевых слов и использует их, чтобы определить, о чем статья (по сути, статье присваивается «оценка релевантности»). Итак, для нашего примера «корпуса для настольных ПК», если он обнаруживает высокую плотность ключевых слов «корпуса для настольных ПК», то он знает, что следует ожидать высокой плотности других связанных терминов (терминов LSI), таких как: ATX, охлаждение, источник питания, материнская плата, игровой футляр, индивидуальный футляр и т. д.

Поисковые системы знают, какие родственные термины ожидать для любого заданного ключевого слова; они стали довольно умными. Поэтому, если они ожидают увидеть в статье определенные связанные ключевые слова, но не находят эти ключевые слова, они присваивают ему более низкую оценку релевантности. Это напрямую влияет на то, где эта статья будет ранжироваться в поисковых системах, когда кто-то будет искать ваше целевое ключевое слово.

LSI - ключевая концепция SEO (поисковая оптимизация). Алгоритмы поисковых систем постоянно совершенствуются, и прямо сейчас они поощряют контент, который имеет хороший баланс терминов LSI с основным ключевым словом статьи. Поэтому, если вы планируете использовать контент, который вы пишете, для создания веб-сайта, оптимизации этого веб-сайта для SEO и монетизации трафика, который приходит на веб-сайт, важно, чтобы ваши статьи содержали хорошее сочетание терминов LSI. Поэтому, когда я читаю статьи, я читаю их с двух разных точек зрения:

1. Человек (хорошо читается?)

2. Специалист по SEO / паук поисковой системы (есть ли хорошая плотность ключевых слов? Много ли терминов LSI?)

Поэтому для будущих маркетинговых мероприятий постарайтесь включить термины LSI. Просто подумайте, какие термины уникальны для той ниши, для которой вы пишете. Часто эти термины встречаются органично, когда вы пишете. Но для достижения наилучших результатов вы должны знать, как пауки поисковых систем будут читать ваш контент.

Возьмем, к примеру, эту запись в блоге. Основная тема этого поста - LSI (латентное семантическое индексирование), но я добавил кучу терминов LSI в этот пост:

  • SEO
  • содержание
  • соответствующие
  • ключевое слово
  • плотность ключевых слов
  • поисковый движок
  • поисковая оптимизация
  • Веб-сайт
  • статьи по маркетингу
  • классифицировать
  • монетизировать

Все эти термины связаны с LSI и более широкой категорией SEO, которую поисковые системы узнают, когда их пауки просканируют этот пост. И результат? Этому сообщению в блоге будет присвоен более высокий балл релевантности для этих категорий. А это означает, что он будет занимать более высокий рейтинг на страницах результатов поисковых систем (SERP). Просто как тот.

Не поймите меня неправильно; LSI - не единственный определяющий фактор того, как ваш контент занимает место в поисковой выдаче. Фактически, это лишь один из сотен, если не тысяч факторов. Тем не менее, он приобретает все большее значение в алгоритмах поисковых систем, поэтому о нем стоит подумать, когда вы пишете контент, оптимизированный для SEO.

Тенденции поиска зависят от ряда тесно взаимодействующих технологий, и вам нужно знать, как они меняются, если вы хотите опережать конкурентов, особенно когда скорость изменений ускоряется по всем направлениям. Существуют технологии устройств, которые дали нам мобильные устройства и более сложные формы локального поиска, веб-технологии, которые позволили большему количеству компаний создавать более креативные веб-сайты, и технологии необработанного поиска, которые делают поиск быстрее, проще и т. Д. актуально для пользователей (среди других классов техники).

Из поисковых технологий одной из самых увлекательных - и наиболее быстро меняющейся - является семантический поиск, способность поисковых систем распознавать и интерпретировать естественный язык запросов пользователей. Семантический поиск развивается поразительными способами, и чем раньше вы начнете к ним адаптироваться, тем лучше.

Колибри (2013)

Hummingbird (2013)

В начале 2000-х не было такого понятия, как «семантический поиск», и распознавание естественного языка казалось для ИИ далекой мечтой. Поисковые машины работали с использованием системы картографирования на основе ключевых слов; они будут идентифицировать определенные ключевые слова и ключевые фразы в вашем запросе, а затем сгенерировать список мест в Интернете, где эти термины использовались наиболее часто и наиболее заметно. С годами этот процесс стал более изощренным, отсеивая неестественно заполненные ключевыми словами страницы и отображая более сложные фразы, но в основном он функционировал одинаково.

Обновление Google Hummingbird изменило правила игры, когда оно вышло в 2013 году. Вместо того, чтобы использовать ключевые слова для поиска наиболее релевантных результатов для запроса, Hummingbird может интерпретировать намерение пользовательского запроса на основе его формулировки и находить соответствующие записи оттуда. Его появление ознаменовало собой значительный отход от стратегий поисковых оптимизаторов, основанных на ключевых словах, вместо этого вынуждая контент-маркетологов усерднее стараться отвечать на вопросы пользователей, проблемы и интересы.

RankBrain (2015)

RankBrain (2015)

В конце прошлого года Google выпустила новый алгоритм машинного обучения для Hummingbird под названием RankBrain. Цель алгоритма - улучшить возможности семантического поиска Hummingbird, постепенно узнавая больше о том, как люди разговаривают (и вводят запросы в поисковые системы). Хотя семантический поиск уже довольно впечатляет, он испытывает трудности, когда пользовательский запрос особенно многословен, сложен или неоднозначен. RankBrain учится на предыдущем опыте, по сути обновляя себя и, в конечном итоге, становится способным разбивать эти сложные и не поддающиеся расшифровке запросы на более управляемые блоки. Это знак приверженности Google нескончаемым этапам совершенствования - без временной и логистической преграды между инженерами и ручными обновлениями этот автоматизированный алгоритм сможет развиваться быстрее, чем когда-либо.

Богатые ответы (в процессе)

Rich Answers (Ongoing)

Вы, несомненно, заметили всплеск «богатых ответов» - термин, которым обозначают краткие записи в поисковой выдаче, занимающие видное место над стандартными результатами поиска. Они могут принимать форму изображений, предложений, абзацев, чисел или любого другого типа ответа, который может немедленно и кратко ответить на ваш запрос (без необходимости перехода на отдельную страницу). Их распространенность растет по трем причинам:

  • Сеть знаний Google постоянно пополняется информацией по большему количеству вопросов.
  • Hummingbird и RankBrain становятся все лучше и лучше понимают запросы пользователей
  • Google хочет давать короткие и немедленные ответы, когда это возможно

Это один из наиболее важных эффектов расширенного анализа семантического поиска, поскольку он снижает зависимость от внешних веб-страниц при ответе на вопросы. Утверждалось, что это в конечном итоге задушит поисковый трафик на все веб-сайты, но мы перейдем этот мост, когда дойдем до него.

Связанные вопросы (текущие)

Related Questions (Ongoing)

Связанные с этим вопросы также растут, особенно за последние несколько месяцев. Вы можете увидеть, как они появляются примерно на полпути к результатам поиска, предлагая вам изучить похожие или часто задаваемые вопросы, связанные с вашим исходным запросом. Однако вы заметите, что ответы на эти вопросы часто отличаются от ответов на них, подразумевая, что за их генерацию отвечает отдельный алгоритм. Неясно, как все это связано вместе, но ясно, что у Google есть долгосрочный план распознавания шаблонов запросов в дополнение к базовому семантическому пониманию.

События, за которыми стоит следить

Если вы читали эту статью с точки зрения SEO, вам может быть интересно, как все это влияет на вас. Да, интересно изучить внутреннюю механику и историю возможностей семантического поиска Google, но какую практическую информацию вы можете уйти?

Во-первых, разберитесь в ключевых областях, которые развивает Google (либо посредством большего количества обновлений вручную, либо с помощью их новых алгоритмов машинного обучения): голосовой поиск, семантическое понимание, подробные ответы и связанные вопросы. Основная задача Google - как можно быстрее и проще передать точную и актуальную информацию в руки поисковиков.

Поэтому ваша цель должна заключаться в том, чтобы помочь Google выполнить свою работу. Уделите больше времени изучению распространенных вопросов в вашей отрасли и напишите на них ответы. Изучите сложные, нишевые темы и создайте свой сайт в микроформате, чтобы Google мог просканировать его в поисках ответов. Станьте авторитетным лицом и предоставьте информацию, которую хотят ваши пользователи, и вы будете вознаграждены в виде большей наглядности. Это так просто.

Как оптимизировать семантический поиск вместо ключевых слов

Вместо этого семантический поиск пытается проанализировать намерение, стоящее за запросом пользователя, поэтому в нашем примере выше, вместо того, чтобы отображать ключевые слова, включенные в запрос, он будет исследовать всю фразу и определять, что этот пользователь пытается найти стоматолога с самым высоким рейтингом в город Бристоль. Затем он будет использовать контекстные подсказки с сайтов и внешние индикаторы, чтобы оценить, какие стоматологи работают в Бристоле и какие из них являются лучшими.

Зная это, вы можете начать вносить значимые изменения, необходимые для того, чтобы ваш сайт был оценен и внесен в список должным образом.

Корректировка заголовков страниц

Adjusting Your Page Titles

Ваш первый шаг - настроить заголовки страниц (и метаописания, пока вы это делаете). По-прежнему рекомендуется использовать слова, которые имеют отношение к вашему бизнесу, и слова, которые люди могут включать в свой поиск, но есть еще несколько факторов, которые необходимо учитывать.

Во-первых, убедитесь, что вы говорите естественно и не коряво. Оптимизация, ориентированная на ключевые слова, может привести к тому, что вы напишете такие заголовки, как «Дантист-хирург-стоматолог в Бристоле, штат Теннесси», что не похоже на предложение, которое мог бы написать нормальный человек. Пишите полными, краткими фразами и как можно точнее описывайте свои страницы. Пока есть четкое указание на то, кто вы и чем занимаетесь, вы будете в хорошей форме.

Во-вторых, будьте осторожны с повторением. Оптимизация, ориентированная на ключевые слова, заставит вас повторять определенную фразу в нескольких заголовках и описаниях по всему сайту. В семантическом поиске это действительно может работать против вас. Не стесняйтесь настраивать таргетинг на несколько фраз, которые могут дать вам конкурентное преимущество, но старайтесь, чтобы ваши страницы были как можно более разнообразными.

Выбор правильных тем

Choosing the Right Topics

Постоянный контент - ваш лучший шанс оптимизировать семантический поиск. Часто люди будут вводить полные вопросы или длинные запросы в Google, и тогда задача Google - найти не контент с наибольшим количеством ключевых слов, общих для запроса, а контент, который в достаточной степени отвечает на вопрос пользователя. Соответственно, ваш контент должен быть сфокусирован на сжатых и описательных ответах на максимально возможное количество запросов пользователей.

Статьи «Как сделать», «почему» и «что» - прекрасные инструменты для этого. Познакомьтесь со своей существующей клиентской базой и выясните, какие общие вопросы у них возникали, когда они впервые искали компанию, подобную вашей. Пишите сообщения, которые прямо отвечают на эти вопросы (с описательными, заостренными заголовками), и у вас не должно возникнуть проблем с ранжированием по этим запросам, когда они возникают. Чем конкретнее ваша ниша, тем лучше.

Написание правильным голосом

Writing in the Correct Voice

Когда дело доходит до написания контента на месте и текущих статей, вам не нужно ничего менять в своем подходе. Однако следует учитывать два момента. Во-первых, напомните себе, что нет необходимости вставлять ключевые слова в свои статьи. Сосредоточьте свои усилия на лаконичности и описании, а остальное придет само собой. Во-вторых, знайте, что большинство семантических запросов длинные и диалоговые, поэтому постарайтесь соответственно сделать свой контент немного более разговорным. Разговорные, повседневные тона более доступны для читателей, поэтому вы не только увеличите свою потенциальную заметность, но и увеличите удержание.

Фактор RankBrain

Напоследок хочу упомянуть RankBrain. RankBrain - это новая надстройка искусственного интеллекта Google для Hummingbird, разработанная для автоматического и регулярного обновления алгоритма Google с целью улучшения его семантического понимания запросов. Проще говоря, его задача - выяснять сложные, неоднозначные типы запросов и отображать их в более простые и естественные версии. Соответственно, ваша контент-стратегия должна быть сосредоточена на более простых и естественных версиях запросов. Вместо того, чтобы снимать сложно сформулированные фразы для редкой, нишевой аудитории, постарайтесь, чтобы ваш голос был как можно более естественным и лаконичным.

Какое будущее у семантического поиска

Google уже впечатляет. Он может разумно угадать значение заданной вами поисковой фразы даже с помощью элементарного обновления Hummingbird. Но будущее семантического поиска, вероятно, выйдет далеко за рамки нынешних ограничений технологии алгоритмов.

Google уже начинает включать различные внешние факторы в свои результаты поиска на основе ваших личных данных. Вы можете напугать вас, узнав, что это происходит, но это также даст вам гораздо более релевантные результаты. Google, вероятно, точно знает, где вы живете, и может использовать вашу предыдущую историю поиска для настройки результатов прогнозируемого поиска.

Если мы возьмем эти факторы и включим их в среду, основанную на семантическом поиске, мы получим поисковую систему, которая может угадывать намерения пользователей на основе их предыдущего поведения - возможно, даже до того, как они будут искать его. Используя большие данные для анализа и интерпретации моделей поведения на основе индивидуальности, времени суток, активности в социальных сетях и даже последних новостей, Google может направить мир поиска в направлении, ранее ограниченном научной фантастикой. Скорее всего, мы на десятилетие или больше дойдем до создания машины, которая сможет точно угадать, о чем вы думаете, но, зная Google, мы, вероятно, уже ближе, чем вы думаете.

Как скорректировать свою стратегию контент-маркетинга

How to Adjust Your Content Marketing Strategy

В некотором смысле ваша стратегия контент-маркетинга не должна измениться. В настоящее время тематические контент-стратегии, как правило, приносят свои плоды. Написание на заданную тему, естественно, привлечет людей, которые ищут ключевые слова, связанные с этой темой. Все дело в том, чтобы дать людям то, что они ищут, и этот фундаментальный принцип останется неизменным.

Однако, чтобы адаптироваться к неизбежно грядущей революции семантического поиска, вам нужно сделать еще один шаг. Вам необходимо понять, почему люди ищут данную тему. Это причудливый способ сказать, что вам нужно лучше понимать свою демографию с помощью опросов, исследований и анализа больших данных . Поймите, что именно мотивирует ваших клиентов искать данную тему, и расширьте свою контент-стратегию, чтобы охватить эти второстепенные мотиваторы.

Это позволит вам опередить поисковые системы - Google попытается понять, что мотивирует вашего клиента, но вы уже это знаете. И если вы сможете предоставить им это актуальность, уникальность и качество, Google вознаградит вас высоким рейтингом.

Заключение

Семантический поиск никуда не денется в ближайшее время, и ваши конкуренты, возможно, уже строят планы завоевать его по-своему. Помните об этом, проводя аудит своего веб-сайта, анализируя и формируя свою стратегию в этом году и в дальнейшем. Успех в SEO заключается не в том, чтобы найти что-то, что работает, и придерживаться этого навсегда; речь идет о постоянном совершенствовании вашего подхода, чтобы учитывать эти увлекательные новые тенденции по мере их появления.