Что такое XML Sitemap?
XML Sitemap — это файл в формате XML (обычно sitemap.xml
), который содержит список URL-адресов сайта и метаданные (например, дату изменения, приоритет) для облегчения индексации страниц поисковыми системами.
Техническая структура
Базовая структура файла:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page1</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Зачем нужен XML Sitemap?
- Ускоряет сканирование больших или динамических сайтов.
- Помогает prioritize важные страницы (через
<priority>
и<changefreq>
). - Решает проблемы дублирования контента (указывет канонические URL).
- Обязателен для Google News и SEO изображений/видео.
Как создать XML Sitemap?
- Автоматические инструменты:
- Плагины CMS (например, Yoast SEO для WordPress).
- Краулеры типа Screaming Frog или SiteBulb.
- Скрипты: На Python (
xml.etree.ElementTree
) или JavaScript. - Динамические карты: Для часто обновляемых сайтов (например, интернет-магазинов).
Рекомендации
- Максимум 50,000 URL на файл (разбивайте на несколько sitemaps).
- Отправляйте через Google Search Console.
- Исключайте страницы, не предназначенные для индексации (например
/admin/
). - Указывайте точный
lastmod
, чтобы избежать лишних запросов.
Дополнительно: Индексные файлы
Для крупных сайтов используйте sitemap index (sitemap-index.xml
):
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-posts.xml</loc>
</sitemap>
</sitemapindex>
Рекомендуемое Чтение