¿Qué es el sitemap y para qué sirve?

sitemap seo

El sitemap es un archivo en formato xml que contiene un esquema de todas las url que forman una página web. Este resumen de todas las páginas que forman la web es una información esquematizada que enviamos a los buscadores.

En este archivo podemos indicar  información adicional como por ejemplo la última fecha de modificación de la URL y la frecuencia de las modificaciones, así como la importancia que tiene cada url respecto el global de la web, es decir, podemos indicar la jerarquía de cada página dentro del conjunto. Lo valores de importancia van desde el 0.0 (valor más bajo) al 1.0 (valor más alto).

El sitemap puede tener un tamaño máximo de 10MB, aunque se puede comprimir en formato CZIP. Debemos tener en cuenta que puede contener un máximo de 50.000 urls, pero si nuestra web tiene más páginas podremos crear varios sitemaps e incluir así todoas las URLs.

El documento sitemap se define con un protocolo preestablecido y está formado por unas etiquetas XML para estructurar la información y facilitar el rastreo de los buscadores. Así, el archivo sitemap sirve para que los motores de búsqueda conozcan la estructura de la web con mayor facilidad y fomentemos el rastreo de las diferentes URLs en función de su importancia. Cuidado, porque enviar el sitemap.xml a Google no significa que el bot vaya a rastrear las URLs de nuestra web tal y como le hemos indicado, es una guía que le enviamos, nada más.

Cómo configurar el archivo sitemap.xml

El archivo sitemap.xml puede configurarse fácilmente desde WordPress mediante plugins como Yoast SEO o XML Sitemaps.

Estos plugins te guiarán paso a paso para que tu archivo sitemap quede configurado con todo el contenido que deseas indexar en buscadores como Google.

Cómo configurar el archivo sitemap.xml en el plugin Yoast SEO de WordPress

En Yoast puedes encontrar la configuración en: Yoast SEO (en el menú de la izquierda) – Ajustes – Mapas del sitio XML (debes activar esta función tal y como mostramos a continuación:

como activar sitemap.xml en plugin yoast wordpress

En el botón «Ver el mapa del sitio XML» puedes ver el sitmap.xml generado. Acostumbra a ser algo http://ejemplo.web/sitemap_index.xml, dónde vemos el índicde del sitemap. Éste índice diferencia entre posts (artículos del blog), páginas, custom posts (típicas secciones de equipo, testimonials, etc), etc. Cada tipo de entrada tiene su sitemap específico. Podemos elegir si excluir las categorías y tags del sitemap, así como excluir determinadas páginas o entradas.

Cómo configurar el archivo sitemap.xml manualmente

Si por contra quieres el sitemap manualmente, puedes hacerlo escribiendo tú mismo el archivo sitemap.xml desde cero o bien mediante herramientas externas como la de este link.

Ejemplo de un archivo sitemap

A continuación mostramos el código de un archivo sitemap.xml de ejemplo.

XML: Mapa del sitio.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://ejemplo.web/</loc>
        <lastmod>2019-01-01</lastmod>
        <changefreq>monthly</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://ejemplo.web/pagina-servicio/</loc>
        <lastmod>2019-01-08</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.5</priority>
    </url>
    <url>
        <loc>http://ejemplo.web/post-blog-1/</loc>
        <lastmod>2021-04-06</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.3</priority>
    </url>
</urlset>

Vamos a explicar con detalle qué significa cada elemento del código:

1. <?xml version="1.0" encoding="UTF-8"?>

Este encabezado declara el documento como XML y especifica:

  • Versión: 1.0 indica que utiliza la versión estándar de XML.
  • Codificación: UTF-8 asegura que se representen correctamente caracteres especiales.

 

2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">...</urlset>
  • Elemento raíz: Define que este archivo es un sitemap.
  • xmlns: Especifica el esquema que sigue el archivo, en este caso, el estándar de sitemaps definido por sitemaps.org.

 

3. <url>...</url>

Cada par de etiquetas <url> encapsula la información de una página específica del sitio. 

 

4. <loc>http://ejemplo.web/pagina-servicio/</loc>

Localización (URL): Especifica la URL de la landing. Indica que esta página se encuentra en http://ejemplo.web/pagina-servicio/

 

5. <lastmod>2019-01-08</lastmod>

Última modificación: Indica la fecha de la última vez que se actualizó el contenido de la página. En el ejemplo informa al motor de búsqueda que la página fue actualizada el 8 de enero de 2019 (recuerda que el formato para este archivo es YYYY-MM-DD)

 

6. <changefreq>monthly</changefreq>

Frecuencia de cambio: Sugerencia sobre la frecuencia con la que el contenido de la página puede cambiar.

Valores comunes incluyen:

  • daily (diariamente)
  • weekly (semanalmente)
  • monthly (mensualmente)
  • never (nunca)

 

7. <priority>...</priority>

Prioridad: Un valor entre 0.0 y 1.0 que indica la importancia relativa de la página en el sitio.

  • 1.0: Máxima prioridad.
  • 0.5: Prioridad media.
  • 0.3: Baja prioridad.
Categorías: SEO