XML Sitemap là gì?
Một XML Sitemap là một tệp có cấu trúc (thường là sitemap.xml
) liệt kê các URL của một trang web cùng với siêu dữ liệu (ví dụ: ngày sửa đổi cuối cùng, độ ưu tiên) để giúp các công cụ tìm kiếm như Google khám phá và lập chỉ mục các trang một cách hiệu quả.
Cấu trúc Kỹ thuật
Một XML Sitemap cơ bản tuân theo sơ đồ này:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page1</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Tại sao nên sử dụng XML Sitemap?
- Cải thiện khả năng thu thập dữ liệu cho các trang web lớn/động.
- Ưu tiên các trang quan trọng (thông qua
<priority>
và<changefreq>
). - Xử lý nội dung trùng lặp bằng cách chỉ định các URL chuẩn.
- Yêu cầu đối với Google Tin tức và SEO video/hình ảnh.
Làm thế nào để tạo XML Sitemap?
- Công cụ Tự động:
- Các plugin CMS (ví dụ: Yoast SEO cho WordPress).
- Các trình thu thập dữ liệu như Screaming Frog hoặc SiteBulb.
- Tập lệnh Tùy chỉnh: Python (
xml.etree.ElementTree
) hoặc JavaScript. - Sitemap Động: Dành cho nội dung được cập nhật thường xuyên (ví dụ: thương mại điện tử).
Các Thực hành Tốt nhất
- Giới hạn 50.000 URL mỗi tệp (chia thành nhiều sitemap nếu cần).
- Gửi qua Google Search Console.
- Loại trừ các trang không thể lập chỉ mục (ví dụ:
/admin/
). - Sử dụng
lastmod
chính xác để giảm bớt các lần thu thập dữ liệu không cần thiết.
Nâng cao: Tệp chỉ mục Sitemap
Đối với các trang web lớn, hãy sử dụng một chỉ mục sitemap (sitemap-index.xml
) để nhóm nhiều sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-posts.xml</loc>
</sitemap>
</sitemapindex>
Bạn Cũng Có Thể Thích