Что такое дублированный контент
Дублированный контент — это контент, который появляется в нескольких местах в Интернете. Например, если веб-сайт A опубликовал часть контента, которая уже была доступна на веб-сайте B, это будет считаться «дублированным контентом».
Как поисковые системы реагирует на дублированный контент
Любая поисковая система не любит дублированный контент. Если обнаружит, что веб-сайт занимается плагиатом и дублирует контент в Интернете, оштрафует этот веб-сайт и опустит его на страницах результатов поисковой системы.
Для владельцев сайтов дублированный контент имеет несколько негативных последствий:
- Поскольку поисковые системы не показывают несколько веб-страниц в поисковой выдаче, видимость этих веб-страниц уменьшается. Если поисковик решит, что вы дублируете контент, ваш веб-сайт не будет ранжироваться в результатах поиска. Это приведет к потере трафика и доверия.
- Если владелец веб-сайта имеет несколько версий одной и той же веб-страницы на своем сайте, доля ссылок будет уменьшена.
3 причины проблем с дублированием контента
Иногда проблемы с дублированным контентом могут возникнуть даже без вашего ведома. Вот 3 распространенные причины, по которым вы можете столкнуться с этой проблемой:
- Варианты URL часто могут вызвать проблемы с дублированием контента. Например, если каждому пользователю назначается другой идентификатор сеанса, вы можете столкнуться с различными вариантами URL-адресов одной и той же веб-страницы.
- Если ваш сайт имеет отдельные версии, одна и та же веб-страница может работать в обеих версиях, создавая несколько веб-страниц.
- Описания продуктов могут привести к очень похожему (дублирующему) контенту на вашем сайте. Например, вы можете создать несколько страниц продукта для одного и того же продукта, который будет использоваться для другой целевой аудитории и категорий.
Как бороться с дублированным контентом
Дубликаты контента не годятся — ни для поисковых систем, ни для владельцев сайтов. Так что же с этим делать?
rel=»canonical»
Атрибут rel = canonical сообщает поисковым системам, что данная веб-страница является копией другого URL и, следовательно, должна рассматриваться как таковая.
Используя этот атрибут, вы сообщаете поисковым системам, что ваша исходная веб-страница имеет другую версию. Более того, все ссылки, SEO и другие возможности ранжирования должны быть направлены на основную версию веб-страницы, а не на дублированную.
Атрибут выглядит так:
<link href = ”URL ОРИГИНАЛЬНОЙ СТРАНИЦЫ” rel = ”canonical” />
Этот атрибут должен быть добавлен к заголовочной части HTML каждой дублированной версии веб-страницы.
301 редирект
Иногда лучший способ исправить проблему с дублированным контентом — настроить 301 редирект и перенаправить поисковые системы и пользователей с дублированной страницы на исходную версию, которую вы хотите сохранить.
Несколько версий веб-страницы часто борются друг с другом за достижение места на странице результатов поисковой системы. Однако, когда вы настраиваете 301-перенаправление, вы прекращаете это соревнование и фактически объединяете их возможности SEO для поддержки главной страницы.
Иногда это может оказать положительное влияние на способность главной страницы занимать более высокие места в поисковой выдаче.
Метатег Noindex
Вы также можете добавить атрибут content = ”noindex, follow” в заголовок HTML дублированной версии, чтобы исключить его из индекса поисковой системы.
Тем самым вы разрешаете сканировать дублирующуюся веб-страницу, но не позволяете поисковой системе индексировать ее в поисковой выдаче.