сервис семантики тематичности текста

В колёса оптимизатора поисковые системы вставляют всё больше палок, черенков швабр и обломков идей: сложнее становится работать со ссылками, спорным остаётся влияние социальных сетей и поведенческого фактора, поэтому семантика текста остаётся одним из немногих инструментов для реального повышения релевантности страницы.

Влияние семантики на релевантность

Что такое релевантность и почему ПС выше поднимают именно релевантные страницы? Всё просто, релевантность – это то, насколько полно страница отвечает на поисковый запрос. Тут играют свою роль:

  1. - Ключевые слова и их группировка,
  2. - Теги,
  3. - Ссылки,
  4. - Поведенческий и кликовый факторы,
  5. - Многое другое.

Не на последнем месте и семантика тематичности текста, то есть, насколько полно в теле документа встречаются важные слова тематической группы, связанные с запросом слова. Для отслеживания групп важных в тематике слов сервис http://stxt.ru/index.php сканирует выдачу по предполагаемым запросам и выводит из неё тематические слова. Например, для запроса «интернет-маркетинг» сервис STXT выдаёт нам слова «книга, практика, обучение, курсы, скачать» и т д. .  То есть, хорошо ранжируются страницы, где есть эти слова, такие страницы интересны пользователям.

="сервис

Анализ семантичности текста поможет дополнить тело web-документа важными словами и даст плюс в ранжировании, при отсутствии значимых косяков в работе оптимизатора.

Ручной сбор слов

Ручной сбор слов семантической тематичности может использоваться при работе с высококонкурентными запросам, это трудоёмкий процесс, но он поможет выйти на новые рубежи продвижения сайта. Подробнее можно об этом почитать тут http://searchengines.guru/showthread.php?t=899417, вкратце же алгоритм действий выглядит так:

  1. - Собираются урлы страниц по нужному запросу из Топ-10,
  2. - Парсится текст страниц в пределах body,
  3. - Скриптом MYSTEM слова лемматизируются и группируются,
  4. - Знаки препинания заменяются пробелами, а пробелы на новую строку,
  5. - Слова сводятся к единому регистру и сохраняются в файл, который открывается в MYSTEM и из него удаляются слова ёмкостью до 3-х букв.

Далее считывается IDF по формуле:

Число Док (Запрос) + Число Док (Слово)

IDF =

Число Док (Запрос +Слово)

Остаётся сосчитать совпадения по процентам и выбрать из коллекции слов важные для ниши.

Работу затрудняет нынешняя выдача Яндекса, в которой столько рандома, что мама не горюй, однако метод действенный и белый, ведь он лишь позволяет узнать, какие слова повышают текстовую релевантность страницы.

Использовать анализ семантической тематичности текста надо на всех страницах с более-менее нормальной конкуренцией, это поможет наполнить web-документ важными словами и снизит водность контента.  Да, не путайте семантику текста (http://advego.ru/text/seo/

скрин 2) и текстовую семантичность связанных слов – первая показывает количество уникальных, значимых и стоп-слов, а также тошноту и водность документа, а вторая наличие в тексте нужных для ниши (связанных) слов.

Убрать водность можно сводя к минимуму в тексте количество предлогов, слов ни о чём (причастий) и прилагательных, тошнота зависит от количества ключевых слов и их однокоренных собратьев.

Водность этого текста 61, тошнотность 3,3 – это нормально для блога, для страниц коммерческого сайта держать воду надо в пределах 50-60, на информационных проектах не надо перепрыгивать за 70%.