Как разрешить повторяющийся контент

Что такое дублированный контент и почему это беспокоит ваш веб-сайт? А еще лучше, как вы можете найти и исправить?

В выпуске на этой неделе Whiteboard Friday специалист команды Moz Learn, Меган, проводит несколько удобных (и вызывающих чувство голода) аналогий, чтобы помочь вам ответить на эти вопросы!

 Анатомия электронного письма Perfect Pitch

Щелкните изображение доски выше, чтобы открыть версию с высоким разрешением в новой вкладке!

Транскрипция видео

Привет, поклонники Moz. Добро пожаловать в очередной выпуск Whiteboard Friday. Я Меган, и я часть команды Learn здесь, в Moz. Сегодня мы поговорим немного о дублированном контенте.

Так почему мы говорим о дублированном контенте?

Что ж, это довольно распространенная проблема, которая часто может немного сбивать с толку. Что это такое? Как это определяется? Почему определенные страницы на моем сайте помечаются как дубликаты друг друга? И самое главное, как мне решить эту проблему, если я обнаружу, что это то, что я хочу решить на моем сайте?

Что такое дублированный контент?

Итак, во-первых, что такое дублированный контент?

По сути, дублированный контент — это контент, который появляется более чем в одном месте в Интернете. Но это может быть не так чисто, как кажется. Контент, который слишком похож, даже если он не идентичен, может считаться дубликатом друг друга.

Размышляя о дублировании контента, важно помнить, что дело не только в том, что видят посетители-люди, когда переходят на ваш сайт и сравнивают две страницы. Это также касается того, что видят поисковые системы и сканеры, когда они обращаются к этим страницам. Поскольку они не могут видеть отображаемую страницу, они обычно уходят из исходного кода страницы, и если этот код слишком похож, поисковый робот может подумать, что он просматривает две версии одной и той же страницы.

Представьте, что вы идете в пекарню, и перед вами два кекса, которые выглядят почти одинаково. У них нет никаких знаков. Как узнать, какой именно вам нужен? Вот что происходит, когда поисковая система обнаруживает две слишком похожие страницы.

Эта путаница между частями контента может привести к таким вещам, как проблемы с ранжированием, потому что поисковые системы могут быть не в состоянии определить, какую страницу они должны ранжировать, или они могут ранжировать неправильную страницу. В инструментах Moz у нас есть 90% -ный порог для повторяющегося контента, что означает, что любые страницы с кодом, который хотя бы на 90% совпадает, будут помечены как дубликаты друг друга.

Решения

Итак, теперь, когда мы вкратце рассмотрели, что такое дублированный контент, что нам с этим делать? Есть несколько разных способов устранить дублирующийся контент.

301 редирект

Первый — это возможность реализовать 301 редирект. Этот вариант будет похож на копию фильма на VHS, которая, возможно, уже не так актуальна.

Итак, вы хотите обязательно предоставить людям цифровую версию, которая транслируется в Интернете. На своем сайте вы можете перенаправлять старые версии страниц на новые, обновленные версии. Это актуально для проблем с изменениями поддоменов или протоколов, а также с обновлениями контента, когда вы больше не хотите, чтобы люди имели доступ к этому старому контенту.

Rel = canonicals

Далее следует возможность реализовать rel = canonicals на вашей странице. Допустим, вы на распродаже выпечки и у вас с собой два вида печенья: сахар и шоколадная крошка. Вы считаете свое сахарное печенье первоклассным. Поэтому, когда люди спрашивают вас, какое из них им следует попробовать, вы указываете им на сахарное печенье, хотя у них все еще есть возможность попробовать шоколадную крошку.

На вашем сайте это будет похоже на продажу двух предметов разного цвета. Вы хотите, чтобы посетители-люди могли видеть и получать доступ к обоим цветам, но вы должны использовать канонический тег, чтобы сообщить поисковым роботам, какая страница более релевантна для ранжирования.

Мета-ноиндекс

У вас также есть возможность помечать страницы как мета-ноиндекс.

Например, у вас может быть два издания вашей любимой книги. Вы будете читать и ссылаться на это второе издание, потому что оно самое новое и самое актуальное. Но вы по-прежнему хотите иметь возможность читать и получать доступ к первой редакции, если вам это понадобится. Мета-теги noindex сообщают поисковому роботу, что он все еще может сканировать эту повторяющуюся страницу, но не должен включать ее в свой индекс. Это может помочь с проблемами дублирования контента из-за таких вещей, как разбиение на страницы.

Добавить контент

Но что, если у вас есть две страницы, которые на самом деле не дублируют друг друга? Они посвящены разным темам, и их следует рассматривать как отдельные части контента. Что ж, в этом случае вы можете добавить больше контента на каждую из этих страниц, чтобы это не сбивало с толку поискового робота.

Это позволит им отличаться друг от друга, и это будет похоже на добавление посыпки и вишни к одному кексу и, возможно, глазури другого цвета к другому.

Используйте Moz Pro для выявления и устранения дублированного контента.

Если вам когда-нибудь понадобится помощь в определении того, какие страницы вашего сайта могут считаться дублирующими друг друга, вам могут помочь Moz Pro Site Crawl и On-Demand Crawl.

В обоих этих инструментах мы будем отмечать, какие страницы считаются дубликатами друг друга, и вы даже можете экспортировать эти данные в CSV, чтобы вы могли анализировать их вне инструмента. Просто небольшой совет. При экспорте этих данных в CSV группа дублированного контента сообщит вам, какие страницы считаются дубликатами друг друга.

Таким образом, любые страницы с одинаковым номером группы повторяющегося контента являются частью одной группы повторяющихся страниц. Это ни в коем случае не исчерпывающий список способов устранения дублированного контента, но я надеюсь, что он поможет указать вам правильное направление, когда дело доходит до решения этой проблемы. Если вам интересно узнать больше об основах и стратегии SEO, обязательно ознакомьтесь с сертификацией по основам SEO, которую предлагает Академия Moz.

Спасибо за просмотр.

Комментарии запрещены.