Сегодня я расскажу о том, как удалить дубли интернет-магазина VirtueMart 1xxx, работающего в связке с Joomla. Сделать рабочим и удобным для продвижения такой симбиоз достаточно сложно, ведь придётся убирать дублирующиеся страницы CMS и магазина VM, а использовать при хорошей посещаемости и большом количестве страниц sh404SEF лучше не надо – будет неслабая нагрузка на сервер.
Типы дублей
В идеале надо убирать все дубли VirtueMart и Joomla –
- - Когда по разным адресам выдаётся одинаковый контент,
- - Когда разные страницы имеют повторяющиеся Title и Meta.
Сразу скажу, что дубли – это чаще всего не плод ошибок, а результат недоработок сеошника вкупе с «родными» погрешностями движка CMS и магазина. То ли создатели не думали о том, что ПС будут ругаться матом на дублирование с целью уберечь свои серверные мощности, то ли руки у них росли от жо яблони – не знаю. Чистый от дублей сайт магазина имеет хорошие перспективы двигаться вверх только за счёт внутренней оптимизации и это особенно актуально по причине большого количества НЧ-запросов, которым внешняя поддержка нужна, как ёжику расчёска (исключение SMO).
Ищем, находим и убираем дубли
Для начала надо грамотно настроить robots.txt под VirtueMart – это обрежет большую часть дублей автоматом. Тут важно не перестараться и не закрыть от индексации то, что надо. Видел умельцев, которые жаловались на то, что при чистоте сайта от дублей трафик прилично падал. При просмотре их творений волосы вставали дыбом, и хотелось перекинуться в эпоху Возрождения, так как в robots было закрыто пол сайта – в одном мешке лежали и категории и ненужные технические страницы. Дабы этого не случилось, проверяете после внесения изменений в robots страницы из основных групп на возможность их удаления через удаление url Яндекса – ненужные должны удаляться, нужны жить.
Вот пример robots.txt с магазина в связке VM 1.1.8 и Joomla:
User-agent: *
Allow: ?option=com_xmap&sitemap=1&view=xml
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /shop/details/
Disallow: /component/user/register.html
Disallow: /component/user/reset.html
Disallow: /component/user/remind.html
Disallow: /*?*
Disallow: /*-.html
Disallow: /mail.html
Disallow: /contakt.html
Disallow: /shop/search*
Sitemap: http://сайт.ru?option=com_xmap&sitemap=1&view=xml
Host: сайт.ru
Коротко об отличие файла от стандартного джумловского.
Директива Disallow: /*-.html закрывает страницу просмотренных товаров, которая не имеет ни META, ни Title, тем не менее, она упорно лезет в индекс и портит карму.
Директива Disallow: /shop/search* закрывает все страницы поиска по магазину.
Директива Disallow: /shop/details/ закрывает технические зеркала страниц товаров.
Если у вас VirtueMart 2, то пропишите дополнительно
Disallow: /*notify$
Disallow: /*askquestion
Они закроют от индексации страницы подписки на уведомления о появлении товаром и страницы вопросов о товаре.
Сто раз писали, но напишу ещё раз, потому что доходит через раз и не до всех – склеивайте морду сайта – она должна быть доступна по одному адресу. Для этого в файле htaccess прописывается 301 (постоянный) редирект –
RewriteEngine On
# RewriteBase /
RewriteCond %{HTTP_HOST} ^www.сайт.ru
RewriteRule (.*) http://сайт.ru/$1 [R=301,L] –
Это редирект с www на без www, то есть главная будет открываться только по сайт.ру.
Дополнительно не будет лишним добавить сразу за этим кодом строку редиректа:
Redirect 301 /shop.html http://сайт.ru/.
Она будет актуальна, если главная страница сайта – это главная страница магазина, если же VM пришит сбоку, то не надо.
После внесения всех этих изменений выкачайте сайт программой Spider и поищите дубликаты по title и description (фото 2).
О том, как прописать уникальные META Description в категории VirtueMart 1.1.8 написано тут. Дополнительно перепроверить сайт на дубли и заодно узнать, есть на нём битые ссылки можно программой Xenu.
На движке магазина VM 2 часто появляются дубли с окончанием feraud, product_name, orderDesc, category_name и прочий мусор. Убираем их в robots директивами:
Disallow: /*orderDesc*
Disallow: /*_*
И в заключение напомню, если у вас много страниц созданных не магазином, а самой Joomla (блог или материалы), то не забывайте устанавливать и включать простейший, как дерево Евы, плагин shnodoubles. Он безболезненно клеит дубли Joomla и не напрягает сервер.