O que é um Sitemap XML?

Um Sitemap XML é um arquivo estruturado (tipicamente sitemap.xml) que lista URLs de um website juntamente com metadados (por exemplo, data da última modificação, prioridade) para ajudar mecanismos de busca como o Google a descobrir e indexar páginas eficientemente.

Estrutura Técnica

Um Sitemap XML básico segue este esquema:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page1</loc>
    <lastmod>2023-10-01</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Por que usar um Sitemap XML?

  • Melhora a rastreabilidade para websites grandes/dinâmicos.
  • Prioriza páginas críticas (via <priority> e <changefreq>).
  • Lida com conteúdo duplicado especificando URLs canônicas.
  • Necessário para Google Notícias e SEO de vídeo/imagem.

Como gerar um Sitemap XML?

  1. Ferramentas Automatizadas:
  • Plugins de CMS (por exemplo, Yoast SEO para WordPress).
  • Crawlers como Screaming Frog ou SiteBulb.
  1. Scripts Personalizados: Python (xml.etree.ElementTree) ou JavaScript.
  2. Sitemaps Dinâmicos: Para conteúdo frequentemente atualizado (por exemplo, e-commerce).

Melhores Práticas

  • Limite a 50.000 URLs por arquivo (divida em vários sitemaps se necessário).
  • Envie via Google Search Console.
  • Exclua páginas não indexáveis (por exemplo, /admin/).
  • Use lastmod com precisão para reduzir rastreamentos desnecessários.

Avançado: Arquivos de Índice de Sitemap

Para sites grandes, use um índice de sitemap (sitemap-index.xml) para agrupar múltiplos sitemaps:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-posts.xml</loc>
  </sitemap>
</sitemapindex>

Você Também Pode Gostar

Run multiple accounts without bans and blocks
Experimente Grátis

Proteção de segurança multi-conta, começando com FlashID

Através da nossa tecnologia de impressão digital, permaneça indetectável.

Proteção de segurança multi-conta, começando com FlashID