1 (изменено: Freeman, 17.06.2023 в 19:18)

Тема: Карта сайта для поисковиков — sitemap.xml

Генерация карты сайта для поисковиков сейчас реализована одноименным расширением, которое, на мой взгляд, никуда не годится: генерирует статический файл, обновляет его при добавлении сообщений/тем (лишние зависимости), не содержит даты последнего обновления и другой полезной информации.

Карта сайта sitemap.xml — одна из базовых возможностей форума, критически необходимая для поисковой оптимизации — должна быть доработана следующим образом:

  • Включена в ядро — в extern.php, где уже реализованы RSS, Atom и HTML для <iframe> на стороннем сайте. Расширение sitemap удаляется.

  • В карту сайта включаются только видимые гостям страницы.

  • Сам sitemap.xml обязательно должен содержать даты последнего обновления тем, разделов и главной страницы форума.

  • Для многостраничных тем должны быть включены URL всех страниц (на основе гостевых настроек).

  • Коэффициент важности тех или иных страниц (тема, раздел, главная) определяются эмпирически во время реализации и тестирования.

  • Частота обновления страниц может высчитываться по среднему промежутку между ответами в теме (необязательно, может быть оставлено на вторую версию).

Тем самым новая карта будет генерироваться динамически, на лету — в момент обращения. Не имея стандартного файла, она должна сообщать поисковикам о своем присутствии:

  • Через robots.txt — обычным порядком.

  • Перенаправлением с sitemap.xml, если сервер имеет такую возможность.

На будущее:

  • По стандарту, если карта сайта содержит больше 50000 URL или имеет размер более 50 МБ, она должна быть разбита на несколько файлов.

2

Re: Карта сайта для поисковиков — sitemap.xml

В чем прелесть карты сайта, генерируемой на лету — автоматическая поддержка зеркал, что для проектов вроде нашего весьма полезно, особенно в военное время.

3

Re: Карта сайта для поисковиков — sitemap.xml

Внезапно оказалось, что Bing запрашивает sitemap.txt, а не XML. В текстовом формате карта сайта тоже может быть. Что же, будет два формата — текстовый и XML.