Не секрет, что практически все пользователи интернета считают дублированный контент вредным для сайтов, так как он негативно влияет на их ранжирование ресурса в поисковых системах.
Для того чтобы глубже вникнуть в суть дублированного контента, следует посмотреть на него с точки зрения не владельца веб-ресурса, а с позиции поисковика, который старается в полной мере отвечать всем потребностям интернет-пользователя. Отталкиваясь от этого принципа работы поисковой системы, можно выделить определённые закономерности влияния дублированного контента на веб-ресурс.
Как известно, дублирование контента условно делят на дублирование страниц в рамках собственного сайта и дублирование контента на внешних ресурсах. Прежде, чем детальнее рассмотреть каждый из видов контента, стоит определиться с понятием, что же такое дублированный контент.
Дублированный контент — это неуникальный контент, скопированный, либо целиком позаимствованный на других ресурсах и размещённый на страницах более чем одного сайта.
Как дублированный контент появляется на ресурсе?
Существует несколько основных причин возникновения дублированного контента на сайте:
А теперь рассмотрим все приведённые выше причины на простых примерах.
Представим, что некий владелец сайта сделал обзор нового смартфона и разместил его на странице своего ресурса. К примеру, у вас также есть сайт аналогичной тематики и вам очень понравился контент вашего конкурента. Допустим, с его разрешения вы копируете данный обзор и размещаете его на своём ресурсе, добавив ссылку на первоисточник, совсем не беспокоясь о том, как создать уникальный контент. Если рассматривать ваши действия с правовой, деловой, либо этической точки зрения к вам нет никаких претензий.
Однако приведём другой пример: вы решили поделиться этой статьей с другими пользователями ресурса, но при этом с целью удержать их на своём сайте, вы не прикрепляете ссылку на первоисточник. В этом случае, напрашивается логичный вопрос: какая из двух представленных статей будет ранжироваться в поисковой системе, как приоритетная?
В сложившейся ситуации играют роль несколько факторов: трастовость ресурса, какой объём дублированного контента был выложен на сайте, какая статья была проиндексирована первой поисковым ботом. Из вышеперечисленных факторов наиболее важным является последний.
Рассмотрим ещё две ситуации с дублированием контента на следующем примере. Предположим, вы являетесь владельцем интернет-магазина. На вашем сайте много информативных страниц с ассортиментом товара и его категориями, В зависимости от варианта сортировки списка, расположение продуктов и страниц внутри категории периодически меняется.
Давайте предположим, что на каждой странице представлено 30 наименований продаваемой продукции. Сортируя товарные списки по алфавиту и по цене, генерируется два различных URL-адреса, т.е. фактически с одинаковым контентом, но разными адресами у вас получаются сразу две страницы.
Чтобы разрешить эту проблему, вам поможет тег canonical, который в каждой страниц является дочерним по отношению к адресу той или иной категории. К адресу категории следует прописать тег rel=canonical, в котором указывается URL родительской категории. Такие страницы поисковая система не будет считает дублями, а их ссылочный вес будет, как у родительской страницы.