Пагинация с главной страницы WordPress в noindex – 3 проверенных метода

SEO в WordPress

В Вордпресс есть много видов генерации сущностей, и многие из них не нужны в выдаче. Страницы автора, архивы дат, рубрики, метки и остальные пользовательские типы. Почти во всех случаях советую ставить в noindex пагинацию WordPress, иначе наплодит кучу дублей в выдаче Яндекса и Google, что приведет к снижению общих показателей сайта.

Как правильно использовать noindex, follow и nofollow

Проблема WordPress пагинации в том, что при переходе по ней ничего не меняется, только содержание карточек постов, а все остальное остается на своих местах, тайтл, дескрипшн и остальные элементы, отличие только в адресе page/2, page/3 и т.д. мы получаем кучу одинаковых страниц в индексе, которые дублируют начальную, так выглядит начальная итерация причем на главной. Не забудьте про серверные заголовки last modified.

где располагается пагинация.
Пример.

В исходном коде видим такую вещь, тайтл и дескрипшн полностью дублированы с домашней страницы, а это не допустимо, ошибка оптимизации и потеря авторитетности.

Дублирование метатегов.
Дубль meta.

Поэтому нужно сделать так что робот брал в оборот только домашнюю, а все остальные просто сканировал, но в индекс не брал. Для этого необходимо сделать соответствующие команды в WordPress.

Пагинация в noindex с помощью кода без canonical

Теперь нужно разобраться со стратегией, она проста, нам нужно проставить к каждой итерации пагинации вот такой код. Noindex говорит что документ индексировать нельзя, но сканировать можно, follow означает что переходить по ссылкам не запрещается.

<meta name="robots" content="noindex,follow"/>

Получаем отличную логику, робот может пройтись по всем ступеням, но в индекс ПС ее не будет. Некоторые спросят, почему не сделать просто canonical на главную? Нет, канонический адрес полностью закроет роботу доступ, как только он до него дойдет, то сразу обрубит дальнейший процесс и не проверит другие страницы, а этого делать нельзя, потому что зачастую пагинация в WordPress единственная возможность добраться до старых статей на блоге.

Пагинация в noindex с помощью кода

Метод простой и подходит для почти всех шаблонов, кроме использующих собственный вывод пагинации, без взаимодействия с ядром WordPress. Похожим методом создается минификация HTML в WordPress.

function wpoptimize_noindex_paged() {
    if ( is_paged() ){
        ?>
<meta name="robots" content="noindex,follow">
        <?php
    }
}
add_action( 'wp_head', 'wpoptimize_noindex_paged', 2 );
Файл функций WP.
Function.
  • Переходим Внешний вид — Редактор тем.
  • В правой колонке находим function php.
  • Пролистываем его в низ и вставляем код.
  • Нажимаем Обновить файл.

С помощью Clearfy PRO

В популярном плагине ClearfyPRO есть опция активации noindex на страницах pagination. Как обычно процесс сводиться к нажатию одного переключателя.

Настройка noindex.
Клеарфай.

В плагине много позиций по улучшению WordPress именно внутренних функций не зависящих от темы, например, закрывает от индексации ссылки в комментариях WP.

Промик на Clearfy

All in one seo pack и Yoast SEO

В настройках All in one seo pack имеет такую настройку, переходим в панель «Настройки индексации (noindex)» внизу включаем пункт указанный на скриншоте, не забываем сохранять.

AIOSP.
AIOSP.

Срабатывает не на всех шаблонах, почему, не знаю, возможна ошибка в расчете приоритета. Перейдем к Yoast SEO, разработчики намеренно убрали возможность ставить noindex на страницах главной пагинации WordPress, объясняется это заявлением специалистов из Google, явно намекнувшие, что долгосрочный ноуиндекс полностью выкидывает документ из поиска, в будущем он их просто не обходит.

Google не единственная поисковая система, поэтому появление дублей в остальных поисковиках дороже.

Управление в Robots txt

Для надежности советую сделать настройку в Robots txt, чтобы управлять поведением робота. Помещаем в него такие комбинации, можете сразу обе.

Disallow: */page 

или со слешем на конце

Disallow: */page/

Должно получиться так, не смотрите на остальное содержание, оно скорее будет другим, но и не добавляйте сразу комбинации, проверьте возможно они уже есть.

Запрет в robots.
Роботс.

В результате получаем следующую логику сканирования пагинации в WordPress:

  • Робот приходит на главную, ничего запрещающего нет, начинает переходить по ссылкам, доходит до пагинации и открывает ее.
  • Видит noindex, follow, значит документ в базу брать нельзя, но сканировать и переходить по ссылкам можно, начинает открывать остальные.
  • Просмотрев всё – итерации не берет в индекс.
  • Для надежности проверяет robots в нем также есть запрет, значит 100% не помещаем в выдачу.

Закончу статью, научились максимально безопасно проставлять атрибуты noindex в пагинации WordPress, чтобы индексацию оставить не применяя каноническую ссылку в rel canonical и не помещать лишние элементы в выдачу.

Женя

Занимаюсь разработкой WordPress уже больше 5 лет, делюсь своими знаниями и опытом на этом блоге.

Оцените автора
WPHacks.ru
Добавить комментарий