Как убрать дубли страниц joomla 3
Перейти к содержимому

Как убрать дубли страниц joomla 3

  • автор:

Как убрать дубли страниц

Подскажите, как можно убрать дубли страниц категорий в joomla типа */ и .html
Или может редирект.

Ответы на пост (10) Написать ответ
04.10.2012 18:40
04.10.2012 19:16

долго искал синтаксис редиректа всех старниц с окончанием / на .html

может кто подскажет как прописать

04.10.2012 19:47
Так что надо, редирект со слеша на без слеша?
04.10.2012 19:54
RewriteBase /
RewriteCond % (.*)
RewriteCond % /$ [NC]
RewriteRule ^(.*)(/)$ $1 [L,R=301]]
04.10.2012 21:03

нет со слеша на *.html

пример: http://inntec.ru/katalog/smartfon/ нужно на http://inntec.ru/katalog/smartfon.html

04.10.2012 21:46
у меня на стандартном сео компоненте и стандартном .htaccess этот редирект работает
04.10.2012 23:11

SEO оптимизация DLE: Часть 2 — Избавляемся от дублирования контента, связанного с URL


01.11.2012 17:36

Насчет html — он вкл. и выкл. в панели управления сайтом, а по поводу дублей нашел отличный модуль на форуме джумловодов — почитай в faq (избавление от дублей) или как-то так

01.11.2012 17:36
тю, не модуль, а плагин ))
11.11.2012 17:25
где иммено можно скачать этот плагин?

Похожие посты

  • Запрет на индексацию
    3
  • Вопрос о теге rel=canonical
    3
  • Get параметры в тильде, как обойти? насколько критично?
    5
  • Помогите убрать дубль страницы
    2
  • Убрать 20 000 дублей на новостном портале
    8
Анализ сайта

Поможем улучшить ваш сайт.

  • Инструменты
  • Анализ сайта
  • SEO-анализ страницы
  • Разовая проверка позиций
  • ChatGPT
  • Проверка посещаемости
  • Аудит сайта
  • Антиплагиат онлайн
  • Мой IP
  • WHOIS домена
  • Проверить сайт на мошенников
  • Сделать фавикон

Как убрать дубли страниц joomla 3

Дублирование страниц является одним из проблемных мест на работающих сайтах. По умолчанию проблема дублей страниц актуальна для всех CMS. Эта проблема не обошла CMS Joomla, где одно из слабых мест — дублирование страниц. Увидеть дубли можно, если на сайте одна и таже страница имеет разные ссылки. В большинстве случаев новичок, создавший сайт на Joomla не подозревает, что с появлением нового сайта, появились дубли созданных страниц. Осознание приходит со временем и опытом. К сожалению, нельзя создав сайт, не получить дубли страниц, но можно с этим поработать.

Прежде всего надо понимать, что дубли страниц мешают оптимизации сайта, а значит и его продвижению. Робот, проходящий по сайту, обнаруживает страницу и инексирует ее c определенной ссылкой. Затем снова встречает страницу с тем же содержанием, но имеющую уже другую ссылку. Возникает путаница. Какую ссылку выдавать по одному и тому же запросу. Поэтому поисковые системы стараются игнорировать дублированные страницы. Возможно будет происходить следующая ситуация, когда ссылка на страницу будет временами меняться, что сразу же повлечет за собой потерю трафика.

При создании сайта важно определиться с его структурой, с именами, которые вы даете меню, категориям, подкатегориям и именам статей. Это нужно для того, чтобы впоследствии не менялись соответственно имена ссылок на сайте. Нужно определиться, в каком виде должна быть конечная ссылка на статью. Далее нужно определиться с сайтом, будет это www, просто http или https.

Соответственно боремся с дублями страниц в CMS Joomla:

1. Прежде всего используем файл .htaccess, благодаря которому можно производить дополнительную конфигурацию веб-сервера (меняем название site.ru на свое имя).

RewriteEngine On

# перенаправление с www на https (если сайт доступен по https)
RewriteCond % ^www\.(.*) [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]

# перенаправление с http на https:
RewriteCond % ^ site \ . ru [NC]
RewriteCond % ^http$
RewriteCond % off
RewriteRule (.*) https://%% [R=301,L]

# убираем полный дубль по адресу site.ru/index.php
RewriteCond % ^[A-Z]\ /index\.php\ HTTP/
RewriteRule ^index\.php$ http:// site.ru / [R=301,L]

# 301 редирект на окончание .html
REDIRECTMATCH 301 (.*/[^/.]+)($|\?)$ http:// site.ru $1.html

# 301 редирект с .html на без .html
REDIRECTMATCH 301 (.*)\.html$ http://site.ru$1

2. Используем файл robot.txt, благодаря которому можно ограничить доступ роботу к содержимому сайта.

User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /log/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /*?
Disallow: /*%
Disallow: /*&
Disallow: /*tag
Disallow: /*print=1
Disallow: /*sovety-k/
Disallow: /*sovety/

User-agent: Yandex
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /log/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /*?
Disallow: /*%
Disallow: /*&
Disallow: /*tag
Disallow: /*print=1
Disallow: /*sovety-k/
Disallow: /*sovety/

Host: site.ru
Sitemap: https:// site.ru /sitemap.xml

Можно использовать различные плагины для Joomla.

Дублирование страниц в Joomla: причины, частые ошибки и их решение.

Каждый, кто создает сайт на Joomla рано или поздно сталкивается с проблемой дубликатов страниц сайта. Давайте посмотрим на эту проблему изнутри, разберемся, что это за дублирующиеся страницы, как поисковые системы реагируют на такие страницы и как не запутаться в дубликатах страниц.

Дубликаты страниц – что это.

Дубликаты страницы – идентичные страницы, доступные по разным URL на вашем сайте. Вообще, дублирующиеся страниц – уязвимое место во многих системах управления контентом, не только в Joomla. Подобные страницы совершенно безвредны пока дело не касается их индексирования поисковыми роботами. Если вы следите за индексированием страниц своего сайта и хотите свести до минимума появление дубликатов страниц в результатах поиска, то следует хорошо продумать структуру сайта.

Ведь главная причина появления дублирующихся страниц – неправильная структура сайта. Первое, что надо продумать – иерархию категорий и пунктов меню. Если вы заранее создадите категории (которые, возможно понадобятся в будущем), то вы сможете избежать появления дубликатов страниц.

Рассмотрим эту ошибку на примере. Предположим, у вас на сайте есть категория «Новости» с подкатегориями «Политика», «Экономика» и т.д. Все публикуемые материалы вы размещаете в подкатегориях. Если вы создадите пункты меню только для дочерних категории, то материал будет иметь такой адрес:

Вариантов образования таких URL масса, и все это будут URL одной и той же страницы. Это пример того, как делать не надо. Еще одна проблема дубликатов страниц – это то, что поисковые системы индексируют технические копии документов по ссылкам «Печать», «PDF», «Поделиться с друзьями».

Когда вы только начинаете планировать свой сайт, не пожалейте времени и хорошенько продумайте его структуру, определите основные категории и подкатегории. Тогда с развитием сайта не нужно будет менять структуру, вы просто добавите дополнительные секции, если это будет необходимо. Реструктурирование уже существующего (активно развивающегося) сайта – вещь неблагодарная: займет уйму времени, да и к тому же сайт гарантированно потеряет имеющиеся позиции в списке результатов поиска (потому что многие страницы, если не все, поменяют свой адрес), что приведет к падению посещаемости.

Как поисковые системы находят дубликаты страниц?

Виновниками здесь выступают сторонние расширения и компоненты, которые разработчики активно устанавливают на свои Joomla-сайты. К примеру, модуль новостей на главной странице может выдавать различные адреса одного и того же материала. Дублирующиеся страницы можно посмотреть по карте сайта, если установлен компонент Xmap. Если ваш сайт уже проиндексирован, то найти дубликаты страниц не так уж и сложно – достаточно скопировать пару уникальных предложений со страницы и вставить этот материал в кавычках в поисковом запросе Google. Если ваш сайт еще не проиндексирован, то помочь вам может XENU (при условии, что сайт ваш не велик). XENU найдет всевозможные ссылки сайта.

Почему следует избегать дубликатов страниц?

Поисковые системы не любят и стараются не индексировать сайты с большим количеством дублирующихся страниц. Необходимость в выводе таких страниц в результатах поиска весьма сомнительна. При оптимизации страниц по ключевым словам выбираются наиболее подходящие страницы сайта и их содержимое оптимизируется. Если эти страницы имеют дупликаты, то при очередном обновлении поисковые системы могут спутать дублирующуюся страницу с основной, что приведет к резкому падению позиций и оседанию трафика.

6 способов избежать дублирующихся страниц

Каждый сайт по-своему уникален и не хотелось бы оставлять какой-то за бортом. Рассмотрим наиболее популярные методы, которые помогут в 99,9% случаях. Можете использовать любой понравившийся вариант или скомбирировать сразу несколько из них. Эти методы подойдут и для других систем управления контентом.

Все эти методы сработают, если у вас включены стандартные SEF и перенаправление URL в глобальных настройках Joomla.

1. Плагин StyleWare Content Canonical.

Этот плагин решает проблему нескольких URL одной и той же страницы. Так что если у вас есть, к примеру, страница с двумя URL component/content/article/32-something.html и something.html, оба URL будут индексироваться с одного URL (something.html).

2. Файл Robots.txt.

Этот файл входит в стандартный пакет Joomla, находится в корневой директории по адресу yourwebsite.com/robots.txt. В robots.txt прописана инструкция для поисковой системы о том, как индексировать сайт. С помощью этого файла можно отключить части сайта. Сделать это можно с помощью строки:

Disallow: /*? #каждая ссылка, содержащая символ ? не будет инфексироваться *

Лишь одна строка избавит вас от большого количества проблемных ссылок, таких как:

  • материалы для печати;
  • ссылка на rss-ленту;
  • результаты поиска на странице сайта;
  • нумерация страниц;
  • а также от других проблем, в зависимости от установленных расширений;

Использовать такую строку или нет — решать вам. Помните, что слишком большой файл robots.txt считается полностью разрешающим. Следите за тем, чтобы случайно не закрыть важные страницы сайта.

3. Перенаправление 301.

Действует тогда, когда у существующих страниц поменялись URL. Подобное перенаправление прописывается в файле .htaccess. Поисковые системы будут тогда знать, что документ перемещен на другой адрес. Этот метод позволяет сохранить индексируемость и посещаемость, а также PageRank.

Перенаправление 301 также используется и для склеивания дублирующихся страниц. Например, хорошо всем известные дупликаты главной страницы Joomla-сайтов: /home или /homepage. Откройте файл .htaccess и введите там строку:

Также перенаправление 301 можно прописать в файле index.php следующим образом:

if($_SERVER['REQUEST_URI'] == '/index.php') header("Location: /",TRUE,301);exit();>?>

Ниже приведен классический пример URL сайта с и без www:

RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]

* example.com замените на URL своего сайта.

4. Мета-тег «robots».

Еще один способ борьбы с появлением дубликатов страниц – использование мета-тега «robots»:

Этот метод работает в Google теперь намного лучше, чем блокирующие команды в файле robots.txt.

Для того чтобы скрыть результаты поиска при использовании стандартного компонента com_search, нужно добавить в файл index.php вашего шаблона:

 $option = JRequest::getVar('option', null); if ($option == 'com_search') : ?>  endif; ?> 

5. Удаление URL с помощью панели вебмастера.

Для сокращения дубликатов страниц, можно удалить URL этих страниц вручную в панели веб-мастера от Google.

6. Заголовки X-Robots-Tag.

Google рекомендует использовать X-Robots-Tag как альтернативу 4-му методу:

Date: Tue, 25 May 2010 21:42:43 GMT

Из вышеперечисленного становится ясно, что методов борьбы с дупликатами страниц много, надо просто понимать, как каждый из них работает, чтобы выбрать наиболее подходящий вариант.

Добавить комментарий
Комментарии

0 # Анастасия 06.06.2013 10:32

«Помните, что слишком большой файл robots.txt считается полностью разрешающим.» — ссылку можно на руководство Yandex или Google, в котором про такое говорится?
Спасибо.

0 # Wedal 06.06.2013 11:29

Анастасия, имеется ввиду то, что слишком большой файл может быть проигнорирован. http://webmasters.ru/news/google-robotstxt-ne-dolzhen-prevyshat-500-kb-1646/

+1 # Miheich 06.06.2013 12:10

У меня плагин установлен -Canonical Links- он сам в head rel=canonical ставит. что про него можете сказать.

0 # Wedal 07.06.2013 03:11

Miheich, тоже вариант. Но использовать нужно с осторожностью. Помните про: http://wedal.ru/news/strashnaya-seo-oshibka-v-joomla-3.html
Может получиться также.

0 # Oleg 07.06.2013 07:31
Пробел нужен,подправь в тексте,а то не будет работать.
Цитата:
Redirect 301 /index.phphttp://site.com/
Redirect 301 /index.php http://site.com/
+6 # Joxxs 30.06.2013 20:26

Вы что друг у друга статьи перепечатываете:
http://joomlablog.ru/joomla-i-seo/390-dubli-stranits-v-joomla-prichiny-oshibki-i-resheniya
Или из одного источника берете?
На самом деле статья не несет в себе почти полезной информации, не указана куча ньюансов, допустим, что нельзя закрывать дубли через роботс если они уже попали в индекс, надо сначала чтоб дубли склеились. Иначе они так и будут висеть грузом на вашем сайте.
Потом плагин , этот плагин Canonical убийство для вашего сайта. Потом в статье не указаны другие инструменты для убивания дублей, которые более эффективны. Даны общие рекомендации, которые нужно читать у поисковиков.

0 # Webtimus 27.09.2014 11:06

Столкнулся с особенностями перелинковки в joomla 2.5.25
После внесения в файл .htaccess строки перенаправления с www.

#RewriteRule ^(.*)$ http://www.site.ru/$1 [R=permanent,L]

Престал работать стандартный компонент «Перелинковка».
Поделитесь, пожалуйста, как правильно реализовать редирект хоста с www, дабы не затронуть работу родного компонента!
Благодарю!

JL No Doubles — убирает дубли страниц

JL No Doubles — плагин призван помочь людям, у которых есть проблемы с дублями страниц, склеить множество одинаковых страниц в одну сделав редирект с не правильной страницы, на правильную. Так же плагин может быть использован, для формирования корректной структуры сайта при ее изменении. Допустим вы изменили алиас пункта меню или перенесли статью в другой раздел.

Этот плагин простой и удобный инструмент, для того, чтоб сократить дубли в несколько раз. Допустим сайт Joomline сократил дубли в 4 раза после начала использования этого плагина.

Плагин основан на Shnodoubles, переданный Hekima на поддержку Joomline.

В комплект входит:

  • Плагин JL No Doubles.

Внимание! Плагин не работает ни с какими компонентами стороннего SEF! Плагин не работает при отключенном SEF Joomla. Возможны проблема с кириллическими URL.

Последняя актуальная версия для Joomla 2.5 — 2.2.0

Где использовать плагин?

Убрать дубли, которые попали в поисковые системы. Автоматические редиректы при изменении структуры сайта.

В других компонентах

Вы можете использовать плагин в: K2, Virtuemart, JoomShopping, HikaShop, Zoo.

Примеры использования

В Joomla страница может иметь массу адресов, и при этом оставаться одной и той же страницей.

Например сайт Joomline имеет такие страницы:

И еще массу других подобных страниц, и все эти страницы могут попасть в индекс поисковиков. Это на самом деле очень не приятно, когда вы заходите в Яндекс вебмастер, или Google вебмастер и видите на своем сайте место 100 страниц 1000, а то и больше. Из-за этого ваш сайт может плохо ранжироваться и вообще испытывать массу трудностей.

Новости по расширению JL No Doubles

JL No Doubles v2.6.0 — поддержка Phoca Cart
JL No Doubles v2.5.1 — отказ от системы лицензирования
JL No Doubles v2.4.3

Возможности JL No Doubles:

  • Поддержка Joomla 3.
  • Локализация: Русский и Английский.
  • Возможность настроить 301 редирект на корректную страницу.
  • Возможность отдавать 404 ошибку при попадании на не корректную страницу.
  • Возможность задать исключения для любого компонента установленного на сайте.
  • Работа с com_content (материалы Joomla), com_tag (теги Joomla).
  • Работа с меню Joomla.
  • Поддержка: K2, Virtuemart, ZOO, JoomShopping, HikaShop, Phoca Cart .
  • JoomShopping поддерживаются: карточки товара, категории и производители.
  • Глубокая поддержка категории Joomla, корректно обрабатывается пагинация и всевозможные дубли категорий.
  • Поддержка исключения регулярных выражений. Полезно для всевозможных систем статистики и расширений, которые не соблюдают правила роутера Joomla.
  • Поддержка мультиязычных сайтов.
  • Поддержка кириллических URL

Еще расширения для вашего сайта

История версий JL No Doubles — убирает дубли страниц

  • Добавлена поддержка Phoca Cart.
  • Изменен Donate.

Вся история версиий

  • Отключена система лицензирования.
  • Изменен сервер обновления.
  • Изменены языковые переменные.
  • Обновлены копирайты.
  • Исправления notice в админ панели Joomla.
  • Исправления для layout com_content.
  • Исправления для JoomShopping.
  • Улучшен редирект.
  • Исправления для K2.
  • Исправления для нового роутера Joomla.
  • Исправления для K2.
  • Добавлена поддержка HikaShop.
  • Исправления для K2.
  • Исправления для K2 кириллица.
  • Мелкие исправления.
  • Исправление тегов К2.
  • Исправления кириллических URL.
  • Исправление для JoomShopping.
  • Исправления для Virtuemart.
  • Улучшена поддержка кириллических URL.
  • Исправление для JoomShopping.
  • Изменение языковых переменных.
  • Исправления для JoomShopping.
  • Дополнительные обработки если не подключены библиотеки.
  • Исправления для компонента тегов.
  • Исправления для отключенного роутера Joomla.
  • Исправления пагинации.
  • Исправления для ZOO.
  • Исправления для Virtuemart.
  • Поддержка urlEncode.
  • Поддрежка компонента тегов.
  • Поддержка JoomShopping. (требует лицензии).
  • Автоматическое определение пагинации в зависимости от настроек категории com_content.
  • Поддержка переменных tmpl.
  • Улучшения для Virtuemart.
  • Исправления для избранного com_content.
  • Багфикс.
  • Исправления для Virtuemart.
  • Исправление стоп слов.
  • Исправление для мультиязычных сайтов.
  • Исправления для com_content.
  • Исправления для virtuematr.
  • Расширена поддержка K2.
  • Расширена поддержка Virtuemart.
  • Расширена поддержка Zoo.
  • Исправлены ошибки.
  • Добавлена поддержка категорий com_content.
  • Добавлена система глобальных исключений параметров не поддерживающих роутер Joomla.
  • Добавлена система лицензирования.
  • Поддержка мультиязычных сайтов.
  • Финальный релиз для Joomla 3.
  • Портирование функций с Joomla 2.5.
  • Исправление ошибок, актуализация кода в связи с новыми требованиями Joomla.
  • Выделение языковых переменных.
  • Локализация на английский язык.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *