Блог Тимура Казанского

Как быстро найти все дубли страниц на сайте?


Всем Привет! Сегодня я расскажу Вам, как легко и быстро найти все дубли или копии страниц на вашем сайте, откуда эти дубли берутся и насколько это опасно. Если например взять мой блог, то изначально я ошибочно полагал, что если написать сайт самому, то никакие дубли точно не страшны, так как есть возможность учесть все нюансы во время разработки.

Но все совсем не так, в процессе отладки и тестирования, их накопилось предостаточно, на данный момент я конечно все почистил, но если говорить о различного рода «cms» например «WordPress» и так далее, то дубли страниц будут 100%, если вы конечно изначально не позаботились об этом и грамотно не заделали все бреши на вашем сайте, что вряд ли. Если взять поисковую систему Яндекс, то она еще умеет более менее разделять копии страниц вашего сайта, а вот в гугле все наоборот, он как пылесос, только появилась неправильная ссылка и будьте уверены, она уже в гугле. Поэтому каждый дубль вашего сайта обязательно появится в поисковике.

Не для кого не секрет дубли страниц – это очень плохо и чем их больше, тем тяжелее становится груз, который тянет ваш сайт на дно. Запомните, поисковики ненавидят дублированные страницы. Посещаемость, индексирование будут в итоге падать и падать, хоть вы и будете регулярно обновлять ваш сайт и всячески продвигать его. Но, как избежать этого? Ничего сложного, я например избавился от всех дублей примерно за минут 10, но у меня и контент конечно всего страниц 30.

Кстати, вы не думайте, что вот вы найдете дубли страниц, удалите их и все, нет, как и везде самое главное найти причину их появления и устранить ее. Вы наверное сразу подумаете, ого, если я не разбираюсь в коде, как же я найду причину, а тем более устраню ее? Ну что тут сказать, я думаю вы справитесь и я постараюсь максимально подробно описать, как это сделать в следующих статьях, а если нет, то найдите кого-нибудь кто разбирается, но устранить нужно обязательно, иначе после удаления из поисковика они появятся снова. И так, как же проверить сайт на дубли?

Открываем поисковик гугл и вводим туда следующую запись: site:вашсайт.ru,

Ищем дубли страниц сайта в гугл

нажимаем поиск, спускаемся в самый низ, где расположены номера всех найденных страниц вашего сайта и идем на самую последнюю страницу. Как только вы достигли последней страницы, вы увидите надпись «Мы скрыли некоторые результаты, которые очень похожи на уже представленные выше (тут будет указано количество страниц). Показать скрытые результаты.» Если этой надписи нет, то это здорово и я вас поздравляю, но такое к сожалению случается редко.

Поэтому запоминаем последнюю строку со страницей в поиске (например 18) на которой мы остановились и щелкаем на ссылку «Показать скрытые результаты».

Открываем поисковик гугл и вводим туда следующую запись: site:вашсайт.ru,

Дубли страниц в скрытых результатах гугла

Теперь снова идем на страницу, которую вы только что запомнили (18), и все что находится далее это и есть те самые копии (дубли) страниц, от которых нам нужно срочно избавиться.

Открываем поисковик гугл и вводим туда следующую запись: site:вашсайт.ru,

Анализируем дубли страниц вашего сайта

Кстати не обязательно, что там будут именно дубли, может быть и наоборот, сам дубль находится в основном списке поисковой выдачи, а оригинал в «скрытых результатах», поэтому теперь вам нужно сравнить их и сделать выводы.

Лучше скопируйте все url дублей, например в блокнот, а потом будете удалять их из поисковиков и думать откуда они взялись. В яндексе, как я уже писал, дела обстоят намного лучше, и чтобы проверить дубли там, достаточно сравнить выявленные дубли страниц из гугла. На этом в общем-то все. Всем пока и в следующих статьях мы с вами подробно разберем, как найти причину возникновения дублей на вашем сайте и как удалить их из поисковых систем.

Кстати, недавно компания Microsoft представила видео техологии ближайшего будущего, посмотрите, очень интересно!

Категория: Все для создания сайтов

Читайте также - самые интересные истории обо мне

Оставьте ваш комментарий

Комментарии: 0