什么是 XML 站点地图?
一个 XML 站点地图 是一种结构化文件(通常为 sitemap.xml),它列出了网站的所有 URL 以及元数据(例如,最后修改日期、优先级),以帮助像 Google 这样的搜索引擎 高效发现和索引页面。
技术结构
基本的 XML 站点地图遵循以下模式:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page1</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
为什么使用 XML 站点地图?
- 改善大型/动态网站的可爬取性。
- 优先处理关键页面(通过
<priority>和<changefreq>)。 - 通过指定规范 URL 处理重复内容。
- 对于 Google 新闻 和 视频/图像 SEO 是必需的。
如何生成 XML 站点地图?
- 自动化工具:
- CMS 插件(例如,WordPress 的 Yoast SEO)。
- 爬虫工具,如 Screaming Frog 或 SiteBulb。
- 自定义脚本:Python(
xml.etree.ElementTree)或 JavaScript。 - 动态站点地图:适用于频繁更新的内容(例如,电子商务)。
最佳实践
- 每个文件限制为 50,000 个 URL(如需则拆分为多个站点地图)。
- 通过 Google 搜索控制台 提交。
- 排除不可索引的页面(例如,
/admin/)。 - 准确使用
lastmod以减少不必要的爬取。
高级:站点地图索引文件
对于大型网站,使用 站点地图索引(sitemap-index.xml)来分组多个站点地图:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-posts.xml</loc>
</sitemap>
</sitemapindex>
您可能还喜欢

