как удалить дубли virtuemart

Сегодня я расскажу о том, как удалить дубли интернет-магазина VirtueMart 1xxx, работающего в связке с Joomla. Сделать рабочим и удобным для продвижения такой симбиоз достаточно сложно, ведь придётся убирать дублирующиеся страницы CMS и магазина VM, а использовать при хорошей посещаемости и большом количестве страниц sh404SEF лучше не надо – будет неслабая нагрузка на сервер.

Типы дублей

В идеале надо убирать все дубли VirtueMart и Joomla –

  1. - Когда по разным адресам выдаётся одинаковый контент,
  2. - Когда разные страницы имеют повторяющиеся Title и Meta.

Сразу скажу, что дубли – это чаще всего не плод ошибок, а результат недоработок сеошника вкупе с «родными» погрешностями движка CMS и магазина. То ли создатели не думали о том, что ПС будут ругаться матом на дублирование с целью уберечь свои серверные мощности, то ли руки у них росли от жо яблони – не знаю. Чистый от дублей сайт магазина имеет хорошие перспективы двигаться вверх только за счёт внутренней оптимизации и это особенно актуально по причине большого количества НЧ-запросов, которым внешняя поддержка нужна, как ёжику расчёска (исключение SMO).

Ищем, находим и убираем дубли

Для начала надо грамотно настроить robots.txt под VirtueMart – это обрежет большую часть дублей автоматом. Тут важно не перестараться и не закрыть от индексации то, что надо. Видел умельцев, которые жаловались на то, что при чистоте сайта от дублей трафик прилично падал. При просмотре их творений волосы вставали дыбом, и хотелось перекинуться в эпоху Возрождения, так как в robots было закрыто пол сайта – в одном мешке лежали и категории и ненужные технические страницы. Дабы этого не случилось, проверяете после внесения изменений в robots страницы из основных групп на возможность их удаления через удаление url Яндекса – ненужные должны удаляться, нужны жить.

Вот пример robots.txt с магазина в связке VM 1.1.8 и Joomla:

User-agent: *

Allow: ?option=com_xmap&sitemap=1&view=xml

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/ 

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Disallow: /shop/details/

Disallow: /component/user/register.html

Disallow: /component/user/reset.html

Disallow: /component/user/remind.html

Disallow: /*?*

Disallow: /*-.html

Disallow: /mail.html

Disallow: /contakt.html

Disallow: /shop/search*

Sitemap: http://сайт.ru?option=com_xmap&sitemap=1&view=xml

Host: сайт.ru

Коротко об отличие файла от стандартного джумловского.

Директива Disallow: /*-.html закрывает страницу просмотренных товаров, которая не имеет ни META, ни Title, тем не менее, она упорно лезет в индекс и портит карму.

Директива Disallow: /shop/search* закрывает все страницы поиска по магазину.

Директива Disallow: /shop/details/  закрывает технические зеркала страниц товаров.

Если у вас VirtueMart 2, то пропишите дополнительно

Disallow: /*notify$

Disallow: /*askquestion

Они закроют от индексации страницы подписки на уведомления о появлении товаром и страницы вопросов о товаре.

spider для поиска дублей

Сто раз писали, но напишу ещё раз, потому что доходит через раз и не до всех – склеивайте морду сайта – она должна быть доступна по одному адресу. Для этого в файле htaccess прописывается 301 (постоянный) редирект

RewriteEngine On

# RewriteBase /

RewriteCond %{HTTP_HOST} ^www.сайт.ru

RewriteRule (.*) http://сайт.ru/$1 [R=301,L]

Это редирект с www на без www, то есть главная будет открываться только по сайт.ру.

Дополнительно не будет лишним добавить сразу за этим кодом строку редиректа:

Redirect 301 /shop.html   http://сайт.ru/.

Она будет актуальна, если главная страница сайта – это главная страница магазина, если же VM пришит сбоку, то не надо.

После внесения всех этих изменений выкачайте сайт программой Spider и поищите дубликаты по title и description (фото 2).

О том, как прописать уникальные META Description в категории VirtueMart 1.1.8 написано тут. Дополнительно перепроверить сайт на дубли и заодно узнать, есть на нём битые ссылки можно программой Xenu.

На движке магазина VM 2 часто появляются дубли с окончанием feraud, product_name, orderDesc, category_name и прочий мусор. Убираем их в robots директивами:

Disallow: /*orderDesc*

Disallow: /*_*

И в заключение напомню, если у вас много страниц созданных не магазином, а самой Joomla (блог или материалы), то не забывайте устанавливать и включать простейший, как дерево Евы, плагин shnodoubles. Он безболезненно клеит дубли Joomla и не напрягает сервер.