В колёса оптимизатора поисковые системы вставляют всё больше палок, черенков швабр и обломков идей: сложнее становится работать со ссылками, спорным остаётся влияние социальных сетей и поведенческого фактора, поэтому семантика текста остаётся одним из немногих инструментов для реального повышения релевантности страницы.
Влияние семантики на релевантность
Что такое релевантность и почему ПС выше поднимают именно релевантные страницы? Всё просто, релевантность – это то, насколько полно страница отвечает на поисковый запрос. Тут играют свою роль:
- - Ключевые слова и их группировка,
- - Теги,
- - Ссылки,
- - Поведенческий и кликовый факторы,
- - Многое другое.
Не на последнем месте и семантика тематичности текста, то есть, насколько полно в теле документа встречаются важные слова тематической группы, связанные с запросом слова. Для отслеживания групп важных в тематике слов сервис http://stxt.ru/index.php сканирует выдачу по предполагаемым запросам и выводит из неё тематические слова. Например, для запроса «интернет-маркетинг» сервис STXT выдаёт нам слова «книга, практика, обучение, курсы, скачать» и т д. . То есть, хорошо ранжируются страницы, где есть эти слова, такие страницы интересны пользователям.
Анализ семантичности текста поможет дополнить тело web-документа важными словами и даст плюс в ранжировании, при отсутствии значимых косяков в работе оптимизатора.
Ручной сбор слов
Ручной сбор слов семантической тематичности может использоваться при работе с высококонкурентными запросам, это трудоёмкий процесс, но он поможет выйти на новые рубежи продвижения сайта. Подробнее можно об этом почитать тут http://searchengines.guru/showthread.php?t=899417, вкратце же алгоритм действий выглядит так:
- - Собираются урлы страниц по нужному запросу из Топ-10,
- - Парсится текст страниц в пределах body,
- - Скриптом MYSTEM слова лемматизируются и группируются,
- - Знаки препинания заменяются пробелами, а пробелы на новую строку,
- - Слова сводятся к единому регистру и сохраняются в файл, который открывается в MYSTEM и из него удаляются слова ёмкостью до 3-х букв.
Далее считывается IDF по формуле:
Число Док (Запрос) + Число Док (Слово)
IDF =
Число Док (Запрос +Слово)
Остаётся сосчитать совпадения по процентам и выбрать из коллекции слов важные для ниши.
Работу затрудняет нынешняя выдача Яндекса, в которой столько рандома, что мама не горюй, однако метод действенный и белый, ведь он лишь позволяет узнать, какие слова повышают текстовую релевантность страницы.
Использовать анализ семантической тематичности текста надо на всех страницах с более-менее нормальной конкуренцией, это поможет наполнить web-документ важными словами и снизит водность контента. Да, не путайте семантику текста (http://advego.ru/text/seo/
скрин 2) и текстовую семантичность связанных слов – первая показывает количество уникальных, значимых и стоп-слов, а также тошноту и водность документа, а вторая наличие в тексте нужных для ниши (связанных) слов.
Убрать водность можно сводя к минимуму в тексте количество предлогов, слов ни о чём (причастий) и прилагательных, тошнота зависит от количества ключевых слов и их однокоренных собратьев.
Водность этого текста 61, тошнотность 3,3 – это нормально для блога, для страниц коммерческого сайта держать воду надо в пределах 50-60, на информационных проектах не надо перепрыгивать за 70%.