¿Qué es el sitemap y para qué sirve?

sitemap seo

Qué es el archivo Sitemap

El sitemap es un archivo en formato xml que contiene un esquema de todas las url que forman una página web. Este resumen de todas las páginas que forman la web es una información esquematizada que enviamos a los buscadores.

En este archivo podemos indicar  información adicional como por ejemplo la última fecha de modificación de la URL y la frecuencia de las modificaciones, así como la importancia que tiene cada url respecto el global de la web, es decir, podemos indicar la jerarquía de cada página dentro del conjunto. Lo valores de importancia van desde el 0.0 (valor más bajo) al 1.0 (valor más alto).

El sitemap puede tener un tamaño máximo de 10MB, aunque se puede comprimir en formato CZIP. Debemos tener en cuenta que puede contener un máximo de 50.000 urls, pero si nuestra web tiene más páginas podremos crear varios sitemaps e incluir así todoas las URLs.

El documento sitemap se define con un protocolo preestablecido y está formado por unas etiquetas XML para estructurar la información y facilitar el rastreo de los buscadores. Así, el archivo sitemap sirve para que los motores de búsqueda conozcan la estructura de la web con mayor facilidad y fomentemos el rastreo de las diferentes URLs en función de su importancia. Cuidado, porque enviar el sitemap.xml a Google no significa que el bot vaya a rastrear las URLs de nuestra web tal y como le hemos indicado, es una guía que le enviamos, nada más.

Cómo crear el archivo sitemap.xml en WordPress

El archivo sitemap.xml puede configurarse y crearse fácilmente desde WordPress mediante plugins como Yoast SEO o XML Sitemaps.

Estos plugins te guiarán paso a paso para que tu archivo sitemap quede configurado con todo el contenido que deseas indexar en buscadores como Google.

Cómo configurar el archivo sitemap.xml en el plugin Yoast SEO de WordPress

En Yoast puedes encontrar la configuración en: Yoast SEO (en el menú de la izquierda) – Ajustes – Mapas del sitio XML (debes activar esta función tal y como mostramos a continuación:

como activar sitemap.xml en plugin yoast wordpress

En el botón «Ver el mapa del sitio XML» puedes ver el sitmap.xml generado. Acostumbra a ser algo http://ejemplo.web/sitemap_index.xml, dónde vemos el índicde del sitemap. Éste índice diferencia entre posts (artículos del blog), páginas, custom posts (típicas secciones de equipo, testimonials, etc), etc. Cada tipo de entrada tiene su sitemap específico. Podemos elegir si excluir las categorías y tags del sitemap, así como excluir determinadas páginas o entradas.

Cómo configurar el archivo sitemap.xml manualmente

Si por contra quieres el sitemap manualmente, puedes hacerlo escribiendo tú mismo el archivo sitemap.xml desde cero o bien mediante herramientas externas como la de este link.

Ejemplo sitemap.xml

A continuación mostramos el código de un archivo sitemap.xml de ejemplo.

Ejemplo de un archivo sitemap XML: Mapa del sitio.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://ejemplo.web/</loc>
        <lastmod>2019-01-01</lastmod>
        <changefreq>monthly</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://ejemplo.web/pagina-servicio/</loc>
        <lastmod>2019-01-08</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.5</priority>
    </url>
    <url>
        <loc>http://ejemplo.web/post-blog-1/</loc>
        <lastmod>2021-04-06</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.3</priority>
    </url>
</urlset>

Vamos a explicar con detalle qué significa cada elemento del código:

 

1. <?xml version="1.0" encoding="UTF-8"?>

 

Este encabezado declara el documento como XML y especifica:

  • Versión: 1.0 indica que utiliza la versión estándar de XML.
  • Codificación: UTF-8 asegura que se representen correctamente caracteres especiales.

 

2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">...</urlset>

 

  • Elemento raíz: Define que este archivo es un sitemap.
  • xmlns: Especifica el esquema que sigue el archivo, en este caso, el estándar de sitemaps definido por sitemaps.org.

 

3. <url>...</url>

 

Cada par de etiquetas <url> encapsula la información de una página específica del sitio.

 

4. <loc>http://ejemplo.web/pagina-servicio/</loc>

 

Localización (URL): Especifica la URL de la landing. Indica que esta página se encuentra en http://ejemplo.web/pagina-servicio/

 

5. <lastmod>2019-01-08</lastmod>

 

Última modificación: Indica la fecha de la última vez que se actualizó el contenido de la página. En el ejemplo informa al motor de búsqueda que la página fue actualizada el 8 de enero de 2019 (recuerda que el formato para este archivo es YYYY-MM-DD)

 

6. <changefreq>monthly</changefreq>

 

Frecuencia de cambio: Sugerencia sobre la frecuencia con la que el contenido de la página puede cambiar.

Valores comunes incluyen:

  • daily (diariamente)
  • weekly (semanalmente)
  • monthly (mensualmente)
  • never (nunca)

 

7. <priority>...</priority>

 

Prioridad: Un valor entre 0.0 y 1.0 que indica la importancia relativa de la página en el sitio.

  • 1.0: Máxima prioridad.
  • 0.5: Prioridad media.
  • 0.3: Baja prioridad.

Este es un ejemplo de un archivo sitemap xml para que se entienda el uso de cada una de sus partes y del código. Si tu web es muy pequeña y sólo tiene 10-20 páginas puedes llegar a plantearte hacerlo manualmente, si es más grande creo que es una tarea que va acabar dándote problema por falta de actualización. Por pequeña que sea la web, siempre aconsejamos el uso de plugins o herramientas para la creación y gestión del archivo sitemap. Como has visto, cualquier plugin de SEO va a gestionar y crear correctamente el archivo, y si no, existen plugins y herramientas externas que harán este trabajo por ti. Si crees que tu archivo sitemap tiene problemas o no consigues crearlo y subirlo a Google no dudes en contactar con nosotros para que te asesoremos.

Dar de alta el Sitemap en Google Search Console paso a paso

Para dar de alta el archivo sitemap.xml en Google deberemos subirlo a nuestro servidor, y quedará algo como miweb.com/sitemap.xml.

Si tu web está hecha en WordPress y gestionas el sitemap con el plugin Yoast SEO podrás ver la URL de tu sitemap accediendo al menú de la izquierda – Ajustes – Ver el mapa del sitio XML.

Ahora pasemos a dar de alta el archivo en Google Search Console: dirígete a tu  propiedad de Google Search Console, y en el menú lateral de la izquierda clica en “Sitemaps”

menu subir sitemap search console

Aquí deberemos introducir la URL de nuestro sitemap y clicar el botón “enviar”:

Una vez se haya procesado nos devolverá el estado del mismo, si lo ha interpretado correctamente nos aparecerá el mensaje “Correcto”, tal y como se muestra en la imagen siguiente:

Si nuestra web está hecha en WordPress y usamos el plugin Yoast SEO, es muy probable que cree el índice de sitemap por defecto, mediante una estructura de URL como esta: miweb.com/sitemap_index.xml. En este caso, es muy probable que debamos dar de alta tanto el índice, como los sitemaps de los diferentes custom posts de WordPress queramos indexar, como son páginas, posts, categorías, tags, productos o portfolio, por poner algunos ejemplos. A continuación explicamos con mayor detalle qué es un índice de sitemap.

Qué es un índice de Sitemap

Un índice de sitemap es un archivo XML que actúa como un mapa de referencia para otros archivos sitemap individuales. En lugar de listar directamente las URL de un sitio web, el índice de sitemap contiene una lista de enlaces a varios sitemaps, lo que permite a los motores de búsqueda como Google o Bing encontrar y procesar múltiples sitemaps de forma más eficiente.

¿Para qué sirve un índice de sitemap?

  1. Organización: Divide un sitio web grande en varios sitemaps más pequeños, lo que facilita la gestión y la lectura por parte de los motores de búsqueda.
  2. Facilitar el rastreo: Ayuda a los motores de búsqueda a descubrir contenido de forma más eficiente al proporcionar una estructura clara y jerarquizada.
  3. Cumplir límites técnicos: Los sitemaps tienen un límite de 50 MB o 50,000 URLs. Si tu sitio supera estas cifras, un índice de sitemap es necesario para distribuir las URLs en varios archivos.

Puedes ampliar la información sobre la gestión y recomendaciones de uso de índice de sitemaps en Google en este artículo.

A continuación, se muestra un ejemplo en que se ha dado de alta un índice de sitemap, un sitemap para páginas y un tercer archivo sitemap para posts (se trata de un portal hecho en WordPress y en el que se gestionan los sitemaps mediante el plugin de Yoast SEO):

Estado rastreo sitemap

Límites del archivo sitemap

El archivo sitemap.xml tiene ciertos límites establecidos tanto por las especificaciones del protocolo XML Sitemap como por las recomendaciones de los motores de búsqueda como Google y Bing. Aquí están los principales límites:

Número de URLs

Un archivo sitemap.xml puede contener hasta 50,000 URLs. Si necesitas incluir más URLs, debes dividirlas en varios archivos sitemap y referenciarlos en un archivo índice (sitemap_index.xml) como se ha comentado anteriormente.

Tamaño máximo del archivo

El tamaño máximo permitido para un archivo sitemap.xml es de 50 MB (descomprimido). Si el archivo supera este tamaño, también debes dividirlo en múltiples sitemaps.

Recomendaciones adicionales sobre el uso del archivo sitemap

Formato del archivo

Debe ser un archivo XML válido y bien formado, que cumpla con la estructura y las etiquetas definidas en el protocolo de Sitemaps. Etiquetas principales: <urlset>, <url>, <loc>, <lastmod>, <changefreq>, <priority>.

URLs válidas

Todas las URLs deben ser absolutas, estar bien formadas y usar un protocolo válido (http o https). Deben pertenecer al dominio o subdominio del sitio web que las aloja.

Codificación

El archivo debe estar codificado en UTF-8.

Acceso y disponibilidad

El archivo debe ser accesible públicamente para los rastreadores. Normalmente, se coloca en la raíz del dominio, como miweb.com/sitemap.xml

Restricciones de contenido

No debes incluir URLs con estado 3xx, 4xx o 5xx. por ejemplo, páginas que sean redirecciones permanentes (301) o URLs que devuelvan errores (404, 500) no deben incluirse en sitemap. Tampoco incluyas URLs que estén bloqueadas por el archivo robots.txt.

Páginas con la etiqueta «noindex»

No debes incluir páginas con la etqiueta «noindex» en el sitemap, ya que sería del todo contradictorio hacer que está página no se indexe en Google y por otro lado, enviarla mediante el sitemap para que el bot de Google la rastree. Si usas plugins como Yoast, al marcar una página como «noindex» está será excluida automáticamente del sitemap.

Categorías: SEO