Главная » Техника продвижения » Внутренние дубли страниц сайта. Техника поиска и методика лечения.

Внутренние дубли страниц сайта. Техника поиска и методика лечения.

Здравствуйте дорогие читатели моего блога. Сегодняшней статьей я начинаю еще одну рубрику – «Техника продвижения», в которой я буду описывать различные фишки поисковой оптимизации вашего сайта.

В данной статье мы поговорим о дублирующем контенте.

Внутренние дубли страниц – это такие страницы сайта, которые отображают пользователю один и тот же контент под разными ссылками (урлами). Зачастую данные страницы формируются движком вашего сайта. Пример таких страниц:

http://вашсайт.com/ — нормальная ссылка на главную страницу сайта.

Дубли:

— http://вашсайт.com/index.php

— http://www.вашсайт.com/

http://вашсайт.com/novost.html — нормальный вид страницы вашего сайта

Дубли:

— http://вашсайт.com/novost — отсутствует приставка .html

— http://вашсайт.com/?p21

Таких примеров огромное количество и у каждой CMS можно их найти. Частым источником дублей являются категории ваших блогов и интернет магазинов, в которых выводится вступление (то что находится перед кнопкой «Подробнее»). А представьте если статья или товар находится нескольких категориях, тогда количество наших дублей существенно приумножается.

Как найти внутренние дубли?

Для того чтобы определить их наличие вам нужно зайти в поисковик, я буду показывать на примере Google, ввести конструкцию:

site:examplesite.ru

В выдаче вы увидите все проиндексированные страницы вашего сайта.

dubli1

Не поленитесь и пройдитесь по них, обращайте внимание на ссылки этих страниц.

Системные папки вам тоже не к чему. Поэтому вы внимательно изучаете ваши проиндексированные страницы и находите проблемные места.

dubli2

Другим, способом, с помощью которого можно определить дубли, является поиск страниц по фрагменту текста. Выделив предложение и поставив его в скобки (“”), ищите его в поисковике. Если вы найдете несколько страниц, с одним и тем же контентом, то это и будут ваши дубли.

Как избавится от дублей страниц на сайте?

Тут существует несколько вариантов. Каждый из них пригоден, а лучше всего использовать их вместе.

Robots.txt

Это первый вариант решения проблемы дублей станиц. Я уже писал о составлении правильного robots.txt, при желании вы можете почитать и более детально ознакомится с этим файлом.

Каким же способом его можно использовать. С помощью данного файла и использования в нем директивы Dissalow. В этом файле мы можем закрывать как отдельные страницы, так и целые категории. Приведу несколько примеров использования.

Например, для того чтобы избавится от дублей страниц вида /?p32, которые формирует движок WordPress достаточно прописать в robots.txt:

Disallow: /*?

Disallow: /*?*

Для того  чтобы закрыть страницу рубрики нужно вписать:

Disallow: /rubrika/

Для закрытия страниц навигации, которые тоже дублируют контент, можно вписать:

Disallow: /page/

Канонические страницы

На данный момент как Яндекс так и Google понимают тег rel=canonical, который показывает для поисковых роботов основную страницу контента, именно эту страницу они будут отображать в поиске.

Многие современные seo плагины поддерживают этот тег, тоесть они сами формируют его и вставляют между тегами <head></head>. В том числе данный функционал вы можете настроить с помощью плагина для WordPress All in One SEO Pack.

dubli3

Редирект 301

Данный метод используется для устранения дублей ссылок с www и без него путем редиректа с неосновного зеркала сайта на основное. Также данный метод применим при смене структуры ссылок, именно тех, которые уже в индексе. В большинстве случаев поисковые роботы вполне адекватно воспринимают такие редиректы.

На сегодня все. Оптимизируйте ваши сайты, поднимайтесь в ТОП, а я буду вам немного подсказывать. До следующих уроков.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *