Что такое дублированный контент

Дублированный контент — это контент, который появляется в нескольких местах в Интернете. Например, если веб-сайт A опубликовал часть контента, которая уже была доступна на веб-сайте B, это будет считаться «дублированным контентом».

Как поисковые системы реагирует на дублированный контент

Любая поисковая система не любит дублированный контент. Если обнаружит, что веб-сайт занимается плагиатом и дублирует контент в Интернете, оштрафует этот веб-сайт и опустит его на страницах результатов поисковой системы.

Для владельцев сайтов дублированный контент имеет несколько негативных последствий:

  • Поскольку поисковые системы не показывают несколько веб-страниц в поисковой выдаче, видимость этих веб-страниц уменьшается. Если поисковик решит, что вы дублируете контент, ваш веб-сайт не будет ранжироваться в результатах поиска. Это приведет к потере трафика и доверия.
  • Если владелец веб-сайта имеет несколько версий одной и той же веб-страницы на своем сайте, доля ссылок будет уменьшена.

3 причины проблем с дублированием контента

Иногда проблемы с дублированным контентом могут возникнуть даже без вашего ведома. Вот 3 распространенные причины, по которым вы можете столкнуться с этой проблемой:

  1. Варианты URL часто могут вызвать проблемы с дублированием контента. Например, если каждому пользователю назначается другой идентификатор сеанса, вы можете столкнуться с различными вариантами URL-адресов одной и той же веб-страницы.
  2. Если ваш сайт имеет отдельные версии, одна и та же веб-страница может работать в обеих версиях, создавая несколько веб-страниц.
  3. Описания продуктов могут привести к очень похожему (дублирующему) контенту на вашем сайте. Например, вы можете создать несколько страниц продукта для одного и того же продукта, который будет использоваться для другой целевой аудитории и категорий.

Как бороться с дублированным контентом

Дубликаты контента не годятся — ни для поисковых систем, ни для владельцев сайтов. Так что же с этим делать?

rel=»canonical»

Атрибут rel = canonical сообщает поисковым системам, что данная веб-страница является копией другого URL и, следовательно, должна рассматриваться как таковая.

Используя этот атрибут, вы сообщаете поисковым системам, что ваша исходная веб-страница имеет другую версию. Более того, все ссылки, SEO и другие возможности ранжирования должны быть направлены на основную версию веб-страницы, а не на дублированную.

Атрибут выглядит так:

<link href = ”URL ОРИГИНАЛЬНОЙ СТРАНИЦЫ” rel = ”canonical” />

Этот атрибут должен быть добавлен к заголовочной части HTML каждой дублированной версии веб-страницы.

301 редирект

Иногда лучший способ исправить проблему с дублированным контентом — настроить 301 редирект и перенаправить поисковые системы и пользователей с дублированной страницы на исходную версию, которую вы хотите сохранить.

Несколько версий веб-страницы часто борются друг с другом за достижение места на странице результатов поисковой системы. Однако, когда вы настраиваете 301-перенаправление, вы прекращаете это соревнование и фактически объединяете их возможности SEO для поддержки главной страницы.

Иногда это может оказать положительное влияние на способность главной страницы занимать более высокие места в поисковой выдаче.

Метатег Noindex

Вы также можете добавить атрибут content = ”noindex, follow” в заголовок HTML дублированной версии, чтобы исключить его из индекса поисковой системы.

Тем самым вы разрешаете сканировать дублирующуюся веб-страницу, но не позволяете поисковой системе индексировать ее в поисковой выдаче.