Поиск и удаление дублей страниц сайта.

Поиск и удаление дублей страниц

В любой сфере деятельности есть свои издержки или недостатки, блоговедение не является исключением. Одним из таких недостатков является самопроизвольное создание различных дублей контента и в задачи любого веб-мастера входят поиск таких дублей и последующее их удаление.

Для того, чтобы поисковые системы не вставляли Вам “палки в колеса”, нужно сперва позаботится о том, чтобы эти самые дубли не создавались. Практически это сделать не- возможно, можно лишь указывать поисковикам, какая страница является канонической с помощью атрибута relcanonical«. В этом случае поисковик индексирует только канонический URL, игнорируя дубли страниц. Если вы используете движок вордпресс, то достаточно установить плагин «All in One SEO Pack», сделать соответствующие настройки и плагин автоматически будет присваивать атрибут relcanonical» в каждый ваш пост.

Основная проблема заключается в том, что помимо дублей страниц, на сайте появляются и дубли медиафайлов, о которых я писал здесь и это еще не все, дублями могут быть и внешние УРЛы, которые ссылаются на страницы вашего сайта с других сайтов. Весь этот хлам заносится в индекс поисковых систем и главным образом в Google. Вы наверное замечали, что в индексе Googla страниц во много раз больше, чем в Yandex.

Начинаем искать дубли страниц, далее я расскажу как, чтобы в последствии удалить их из индекса Google.

Ниже представлена следующая конструкция ссылки:

priminfobiss:incomeeasily.ru  Как вы догадались, priminfobiss — это мой сайт, на котором вы сейчас находитесь, замените его на свой домен, затем скопируйте полученную ссылку и вставьте в поисковую строку браузера, в моем случае это Google hrome.

Страницу с полученными результатами выдачи прокручиваем в самый низ и видим следующее:

поиск дублей

Кликаем по ссылке “Показать скрытые результаты”. Все, что выдаст поиск — это дубли, которые находятся в индексе гугла. Теперь остается дело за малым, вручную удалить эти дубли из индекса.

Заходим в инструменты для веб-мастеров и кликаем по нужному сайту.

Удаление дублей страниц

В открывшейся вкладке находим слева “Панель инструментов сайта” и переходим в “индекс Google”

удаляем дубли вручную

Кликаем на “Удалить URL  адреса”, после чего попадаем на страницу, где нам предлагают создать новый запрос на удаление.

14

Кликаем по области “Создать новый запрос на удаление” и в появившееся поле вставляем ссылку, которую хотим удалить из индекса, для этого заходим в результаты выдачи vashdomen:incomeeasily.ru, копируем ссылку, как показано на скриншоте…

находим дубли страниц

Вставляем ее в соответствующее поле и нажимаем “продолжить”

16

Затем отправляем запрос, как показано на скриншоте:

17

После этих действий ссылка которая подлежит удалению из индекса, встает в очередь, а вы повторяете процедуру до тех пор, пока не удалите все дубли.

18

Таким вот нехитрым способом осуществляется поиск ненужных дублей страниц в индексе и их удаление.

2 Responses to Поиск и удаление дублей страниц сайта.

  1. Ивашка:

    На сколько мне известно, Google уже не обращает на дубли, где то читал

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *