Как должна выглядеть оптимальная ссылочная структура WordPress

Приветсвую всех!!!
Данный материал меня побудили написать комментарии к предыдущей статье, и её обсуждение. Похоже, то, что для одних является банальными и элементарными вещами — притчей во язытцах — для других есть тайна за семью печатями. Что-ж, будем срывать покровы тайны с простой, но весьма важной информации, а именно — как должна выглядеть оптимальная ссылочная структура для блогов и сайтов на основе WordPress.
Как уже знают практически все, WordPress — это весьма развитая динамическая структура на основе .рhp, в которой настраивается практически ВСЁ. Все материалы в WordPress сгруппированы по темам, тегам, меткам, архивам, и т.д. Основное разделение материалов происходит по категориям, или — так называемым рубрикам. Все эти архивы, рубрики и категории содержат одинаковые по тематике материалы, точнее — их анонсы: краткое описание статей и постов, что весьма удобно для посетителей-пользователей, при поиске того или иного материала.
Однако, такой «сервис» совершенно НЕ приемлем для поисковых систем, их верных работников — поисковых роботов. Т.к. для поисковиков актуален исключительно УНИКАЛЬНЫЙ КОНТЕНТ, т.е. — конечные страницы постов и статей, а так-же — статические страницы. Все архивы, рубрики и категории, с анонсами или полными повторами текстов, поисковики воспринимают как дублированный контент, то есть — спам. И за него беспощадно штрафуют, или как минимум — понижают в поисковой выдаче.
Поэтому, надо отделять зёрна от плевел, и скрывать дублированный контент от поисковых роботов. Но для начала — надо чётко разделить и обозначить, что есть страницы постов и статические страницы, а что — архивы и рубрики. Запутаться тут легко, даже человеку, особенно если учесть, что и те и другие формируются данимически, что называется — на лету, посредством .php.
Итак, правило номер один: все категории, рубрики, архивы и результаты поиска — являются проходными адресами, т.е. — НЕ конечным материалом, а разделом, группирующим в себе контент с конечных адресов, объединённый в группу по какому либо признаку. Например — тема, метка, автор, результат поискового запроса, и т.д. Такие проходные адреса аналогичны каталогам на сервере, в которых сгруппирован страницы в виде файлов .html.
А ВСЕ АДРЕСА КАТАЛОГОВ ДОЛЖНЫ ЗАКАНЧИВАТЬСЯ СЛЭШЕМ — КОСОЙ ЧЕРТОЙ!!!
Правило номер два: все страницы с уникальным контентом — статические страницы и страницы постов — являются конечными адресами, и как файлы страниц в каталогах на сервере — должны заканчиваться расширением .html, точнее — URL-адреса этих страниц должны заканчиваться расширением .html.
URL-адреса статических страниц и страниц постов должны заканчиваться расширением .html!!!
Эти два правила позволят и поисковикам и людям отличать страницы с уникальным контентом от солянок-сборников — рубрик, архивов и каталогов.
Правило номер три: ВСЕ архивы, каталоги и рубрики, являющиеся источниками дублированного контента, должны быть закрыты от индексации поисковыми системами, через файл robots.txt и посредством мета-тегов meta name=»robots», в заголовках страниц.
Закрывайте от индексации все рубрики, архивы и каталоги!!!
Это избавит вас от проблем, типа — исключения страниц из индекса, понижения позиций в поисковой выдаче, потери ТИЦ и PR, или полного бана вообще.
Правило номер четыре: конечные адреса — статических страниц и страниц постов — должны иметь уровень вложенности (УВ) — ОДИН, т.е. URI страницы НЕ ДОЛЖЕН БЫТЬ ОТДЕЛЁН от URL домена каким-либо префиксом, типа — category/, 2012/, partnyorki/, и прочей ерундой. Это укоротит URL-адрес страницы в целом, упростить работу поисковому роботу при переходе по ссылке, и повысит ценность страницы в глазах поисковых систем и различных сервисов.
Настраивайте постоянным ссылкам уровен вложенности ОДИН!
Ну вот, пожалуй, те несколько ОСНОВНЫХ и самых главных правил, которые избавят в будущем от кучи геммороя ваш блог или сайт. И помните: намного проще всё сделать правильно, как надо, с самого начала, чем потом — исправлять недостатки, когда ваш ресурс уже проиндексирован по старым, НЕПРАВИЛЬНЫМ адресам и ссылкам. Как технически реализовать все эти правила, и что для этого нужно делать — в следующей статье. Следите за новостями!
1 и 2 согласен.
3 спорно — кто-то закрывает, кто-то нет. Результат один и тот же
4. не согласен — разницы нет. Какая разница, какой уровень вложенности? Что страница с УВ1 несет большую ценность чем страница с УВ2?
По третьему вопросу: неоднократно наблюдал, как страницы постов вылетали из индекса, за дубли в категориях и архивах. Так что — результат далеко не один и тот же, однако — можно ещё поспорить.
По четвёртому вопросу: разница в том, что — НА БИРЖАХ ПО ПРОДАЖЕ ССЫЛОК, ССЫЛКИ СО СТРАНИЦ С ПЕРВЫМ УРОВНЕМ ВЛОЖЕННОСТИ СТОЯТ НАМНОГО ДОРОЖЕ, ЧЕМ СО СТРАНИЦ СО ВТОРЫМ И С ТРЕТЬИМ. А причина всего одна: они ЛУЧШЕ индексируются. В качестве подтверждения, можете почитать это в хелпе любой ссылочной биржи.
А в целом — спасибо, что присоединились к теме. Добро пожаловать на блог.
Дмитрий, здравствуйте, хотелось бы спросить по пункту 3. Ни для кого не секрет, что поисковые роботы становятся все «интеллектуальнее», проверяя ссылки на удобство восприятия человеком (или секрет?), в общем, уже не помню, где я об этом читал. В таком случае разбивка по категориям будет только в плюс, разве нет? А на одном домене дублированный контент не будет воспринят как ошибка и не может служить причиной для выхода сайта или его отдельных страниц из индекса.
По пункту 1 вопросов нет, по п. 2 — обозначив «статичность» страниц расширением html, не закроем ли мы их от дальнейшей индексации и не будет ли более правильно оставить «стандартный» вариант?
По п. 4 с учетом вашего комментария — согласен.
По остальным хотелось бы получить ответы на вопросы. Спасибо за внимание, буду использовать ваши рекомендации в работе и проверю на практике.
Здравствуйте. Насчёт пункта 3: поисковые роботы не разделят контент «по категориям» — точнее — для них нет такого критерия, как — категория. Категория служит, скорее всего — для удобства пользователя, позиционирую материал по отдельной теме. Это раз. Во вторых, кроме категорий есть ещё несколько видов дублированного контента — это и страницы результатов поиска, и страницы архивов по датам и автору, и — главная, где выложены анонсы статей, и разбиты тоже на страницы. Я специально задавал вопрос в службу поддержки Яндекса, ответ был следующим, цитирую дословно: «… ну, ЕСЛИ дублирование контента предназначено для удобства пользователей, то поисковый робот НАВЕРНОЕ не будет применять к нему штрафные санкции…» Т.е. — ЕСЛИ и НАВЕРНОЕ — не очень весомый аргумент.
Во всех же остальных мануалах специалисты РЕКОМЕНДУЮТ закрывать ЛЮБОЙ дублированный контент. Т.к. дубль контента воспринимается как СПАМ, не зависимо, на какой странице он расположен.
Разбивку по категориям делать конечно же — НУЖНО, в первую очередь — для удобства посетителей. НО — страницы с дублями — а именно страницы анонсов статей отдельно по категориям — надо ЗАКРЫВАТЬ! от индексации. Поисковый робот всё равно такую страницу в индекс не пустит, а вот забанить за неё — может. Вы хоть раз в жизни встречали в индексе страницу анонсов статей какой либо категории какого либо сайта? Лично я — нет.
Другая сторона вопроса — нужно ли включать название категории в URI страницы? на мой взгляд — это тоже бессмысленно: пользователи получают краткую информацию о странице из описания и сниппета, а не из URLa, роботу — это тем более по барабану, но зато — увеличится уровень вложенности страниц, плюс — длинна ссылки.
Насчёт закрытия страницы от индексации, если у неё будет расширение .html — считаю полной ерундой! Запрет индексации — либо в файле robots.txt — прямое указание поисковому роботу, либо — мета-тег robots в заголовке страницы — со значением noindex, nofollow. Расширение .html — это общепринятый СТАНДАРТ интернет-страниц, с которого, можно сказать, всё началось.
Дмитрий, уровень вложенности страницы определяется не тем, в каких категориях она находится, а тем, сколько кликов до ней ведет с главной! Это раз…
По поводу закрывания категорий еще раз скажу, что вопрос спорный. На одном из моих сайтов процент общей индексации статей наоборот улучшился после того, как я открыл категории. И одно я знаю 100%: поисковые роботы не настолько тупы, чтобы не понимать, содержится на странице просто текст или это страница категории с анонсами статей.
Есть уровень вложенности ФИЗИЧЕСКИЙ — расположение файлов в каталогах и подкаталогах на сервере, есть НАВИГАЦИОННЫЙ — тот, который вы описали, т.е. — количество кликов от главной до нужного документа, есть уровень вложенности, выраженный в URL, когда конечное имя страницы отделено от домена категориями или архивами.
По поводу НЕзакрывания категорий: вы лично видели хотя бы одну страницу категорий с анонсами в индексе какой либо ПС? Лично я — нет. Категории — возможно полезны лишь как АЛЬТЕРНАТИВНЫЙ путь к конечным документам для поискового робота, что бы их проиндексировать, если НЕТ КАРТЫ САЙТА!!! Но в настоящее время робот прекрасно добирается до всех страниц через файл sitemap.xml. Так что — категории НА МОЙ ВЗГЛЯД, полезны исключительно для пользователя — как инструмент навигации по тематическим разделам.
Впрочем, сколько людей — столько мнений! Я вам своего не навязываю, и на ваше не покушаюсь.
С уважением.