Дублі сторінок: як знайти та виправити

28 вересня 2023 р.

SEO

Taras Soros

27 переглядів

Дублі сторінок або їхнього контенту являє собою текст на сторінці, який відображається однаково або практично однаково на різних URL-адресах.

Таке може статися з кількох причин:

  • Основний контент сторінки є незначним порівняно з додатковим вмістом, таким як заголовок, підвал (футер), бічна панель або повторювана інформація на сторінках. Однак багато пошукових систем зменшують значущість цих розділів і фокусуються на основному контенті сторінки.
  • Повторне використання стандартного тексту в заголовках, назвах сторінок або мета-описах, що призводить до однакового відображення сніпетів результатів пошуку для різних сторінок, хоча самі сторінки можуть відрізнятися.
  • Наявність двох ідентичних версій сторінки, наприклад, для цілей тестування.
  • Наявність схожих сторінок, які містять мінімальні відмінності, наприклад, сторінка товару для велосипеда рамою 17 і сторінка товару для рами 18, де єдиною відмінністю може бути зазначення розміру в назві товару.

Зрештою, навіть якщо ви не використовували контент в інших місцях, дубльований контент може бути створений системою управління контентом (CMS), такою як WordPress, яка може мати кілька способів адресації однієї і тієї ж сторінки.

Важливо пам’ятати, що для пошукових систем одна сторінка, на яку можна потрапити через різні URL-адреси, не розглядається як одна сторінка, а сприймається як кілька різних сторінок з однаковим змістом. Наприклад:

  • https://www.example.com/about/
  • http://www.example.com/about/
  • https://www.example.com/about?utm=my_parameter
  • https://www.example.com/category/article/100/

Розглянемо приклад вище як проблему дублювання контенту. Отож, як пошукова система визначить, який URL є основним і має бути проіндексований? Якщо всі ці URL-адреси будуть проіндексовані та почнуть конкурувати за рейтинг у пошукових результатах і кліки користувачів, виникає проблема “канібалізації запитів”. Це може призвести до зниження позицій усіх сторінок порівняно з позиціями, які вони могли б посідати за умови використання лише однієї URL-адреси.

Контент, який слід перевірити на повне або часткове дублювання, включає:

  • Назви сторінок (мета-заголовки)
  • Теги H1
  • Теги H2 (зазвичай їх перевірку опускають)
  • Мета-описи
  • Текст на повній сторінці (основний контент)

У результаті проведеного аудиту має бути складено список сторінок із проблемами дублювання, зазначено тип проблеми, а також надано список сторінок, на яких виявлено такий самий зміст.

Найкращим рішенням є повна унікалізація контенту, мета-заголовків, мета-описів і тегів H1.

Коли дублювання контенту відбувається через наявність кількох URL-адрес для однієї сторінки, найефективнішою стратегією є інформування пошукових систем про те, яка URL-адреса є основною, а які URL-адреси є додатковими посиланнями на цю сторінку.

Тег канонікал для унікалізації

Для розв’язання цієї проблеми використовується тег <link rel=”canonical”>, який має бути присутнім на всіх сторінках із дубльованим контентом і вказувати на ту URL-адресу, яку ви хочете, щоб пошукові системи проіндексували.

Елемент rel=canonical, також відомий як “канонічне посилання”, являє собою HTML-елемент, який допомагає веб-майстрам запобігти проблемам із дублюванням контенту. Він вказує “канонічний URL” або “бажану” версію веб-сторінки. Зазвичай це вихідний URL сторінки. Використання канонічних URL-адрес покращує SEO-оптимізацію вашого сайту.

Ідея проста: якщо у вас є кілька версій одного й того самого контенту, ви обираєте одну “канонічну” версію і вказуєте пошуковим системам на неї.

Додавання канонічного елемента до URL-адреси повідомляє пошуковим системам, що саме цю URL-адресу слід відображати в їхніх результатах пошуку.

Пошук проблеми

Під час проведення аудиту важливо скласти список канонізованих URL-адрес і URL-адрес, на які вони вказують.

Переконайтеся в такому:

  • Усі сторінки-дублі з різними URL-адресами мають канонічну URL-адресу.
  • Вкажіть, чи має канонічна URL-адреса мобільну версію, додавши параметр <link rel=”alternate”> у заголовок канонічної URL-адреси.
  • Google надає кілька звітів в інструменті Google Search Console (GSC) у розділі “Сторінки – неіндексовані сторінки”, де відображаються списки сторінок, що дублюються.
Канонікал

Альтернативна сторінка з належним тегом канонічної сторінки

Ваша сторінка, хоча і є дублікатом іншої сторінки, не містить відповідної позначки. Це означає, що робот Google вважає іншу версію цієї сторінки канонічною і не індексує дублікат у результатах пошуку. Щоб дізнатися, який ресурс робот Google вважає вихідним, ви можете скористатися інструментом перевірки URL.

Якщо канонічною сторінкою є правильна версія, тоді можна нічого не робити. Однак, якщо сталася помилка і канонічною сторінкою обрано неправильний ресурс, ви можете виконати нормалізацію. Щоб уникнути того, щоб вашу сторінку вважали копією сторінки, яку вже занесено до індексу Google як канонічну, вміст цих двох сторінок має значно відрізнятися.

Копія. Система Google вибрала іншу канонічну сторінку, ніж користувач

Даний URL був відзначений як канонічний для набору сторінок, проте Google визначив, що інший URL краще підходить в якості канонічного. Робот проіндексував не цю конкретну сторінку, а ту, яку вибрав Google. Для того, щоб дізнатися, який ресурс був обраний роботом Google як канонічний, слід перевірити цей URL. Щоб уникнути того, щоб ваша сторінка вважалася копією вже занесеної до індексу Google сторінки як канонічної, вміст цих двох сторінок має істотно відрізнятися.

Читайте також
301 редірект у файлі .htaccess 301 редірект у файлі .htaccess

Правила 301 редіректу можна прописувати у файлі .htaccess. Це серверний файл програми Apache.

Редірект: їхні типи та використання Редірект: їхні типи та використання

Редірект – це спосіб перенаправити користувачів, та пошукових роботів на іншу веб-сторінку

Пошукові оператори Google Пошукові оператори Google

Які є пошукові оператори, та як їх вводити. Використання пошукових операторів google для власної вигоди.