Un mapa del sitio o Sitemap es una tabla de contenidos que incluye un dominio específico. En este documento se enumeran las diferentes direcciones URL y subpáginas de la página y el principal objetivo es que Google y otros motores de búsqueda vean la estructura de la misma. El mapa del sitio también puede contener metadatos importantes, indicar los rastreadores de motores de búsqueda cuando una página se actualizó por última vez, la frecuencia con que se cambia y la importancia de cada página en relación con otras.
Para una mayor simplificación, también se puede crear un vídeo-Sitemap o Sitemap de imágenes para que estos medios también sean reconocidos por Google. Para vídeos, por ejemplo, se incluye información determinada como la duración del vídeo, la categoría y la edad idónea y para una imagen se puede especificar el asunto, el tipo o la licencia.
En este video Google explica directamenta la utilidad del sitemap:
¿Siempre tengo que crear un mapa del sitio?
No. Google ha comunicado en repetidas ocasiones que una página web pequeña y manejable en realidad no necesita mapa del sitio, ya que el buscador puede detectar con facilidad la estructura de estas páginas con sus propios rastreadores. Esto requiere, sin embargo, que la página esté vinculada través de enlaces internos y que el sitio esté bien estructurado.
Tendría sentido para Google un mapa del sitio si:
- Tu página web es muy amplia. En este caso, es probable que los rastreadores web de Google pasen por alto durante el rastreo algunas de tus páginas más nuevas o actualizadas recientemente.
- Tu sitio tiene un archivo demasiado grande de subpáginas que están separadas unas de otras o sin vincular. Si tus páginas web no hacen referencia unas a otras, se pueden listar las páginas de un mapa del sitio para que Google no las pase por alto.
- Tu sitio es nuevo y tiene pocos enlaces entrantes. El bot de Google y otros rastreadores controlarán la web siguiendo los enlaces de una página a otra.
- Por lo tanto, tus páginas no podrán ser reconocidas por Google si otros sitios no las enlazan.
- Tu sitio utiliza contenidos de medios de confianza, esto se mostrará en Google News. Google también puede considerar la información adicional de Sitemaps.
Formatos de Sitemaps
Hay varias maneras de crear un mapa del sitio y también diferentes formatos de un mapa del sitio, con el que los rastreadores del motor de búsqueda pueden trabajar. El formato más común es un archivo XML. Se trata de un protocolo de mapa estándar, al igual que en Schema.org, que es un estándar y es aceptado por todos los motores de búsqueda. Aquí ponemos un ejemplo de un mapa del sitio en XML:
Para obtener más información acerca de los Sitemaps, consulta el siguiente enlace: https://www.sitemaps.org/de/protocol.html
RSS, mRSS, y Atom 1.0
Muchos de los sistemas de gestión de contenidos -como Joomla o WordPress- ofertan RSS o Atom 1.0. Estos feeds son aceptados por el buscador y se pueden conectar con la Google Search Console.
Mapa del sitio en archivo de texto
Aunque no se proporcione tanta información para Google, un mapa del sitio se consigue con un simple archivo de texto en formato .txt (codificación UTF-8). Se podría llamar a este archivo sitemap.txt. que contiene una lista de URL y cada URL en su propia línea. Para diseñar un Sitemap, se deben tener en cuenta algunas reglas:
- Utiliza URL consistentes. Google rastrea las URL exactamente tal y como se ingresaron en el mapa del sitio así que especifica las rutas o si redirecciones los dominios con la versión sin o con www.
- No incluir identificadores de sesión de URL en su sitio en el Sitemap.
- Avisar a Google si tienes versiones traducidas de una misma URL a través del mapa del sitio. Para ello, utiliza la URL canónica y hreflang, puedes echarle un vistazo a este artículo del blog que trata este tema en profundidad.
- Divide en varios sitemaps más pequeños si tu dominio es muy grande para que el servidor no se sobrecargue cuando Google rastree el Sitemap. Un archivo de mapa del sitio no podrá exceder de 50.000 URLs y el archivo no debe ser mayor de 10 MB sin comprimir.
- Utiliza un índice del sitio en el que se enumeren todos los sitemaps y presenta este archivo en lugar de los sitemaps.
Localización en el archivo robots.txt
Un mapa del sitio creado debe estar siempre en el directorio raíz de un dominio. Si se trata de un mapa del sitio XML, entonces debería ser accesible bajo el enlace www.dominio.es/sitemap.xml. Google encontrará esto muy rápido y servirá de apoyo a los motores de búsqueda, la ruta del sitio se especifica en el archivo robots.txt (por supuesto adaptado a sus circunstancias).
Incluye el sitemap en la Google Search Console
Para obtener asistencia adicional, es conveniente incluir el mapa del sitio en Google Search Console. Se pueden definir tanto los sitemaps normales, así como de vídeo o imágenes.
Esto requiere una cuenta de Google, que se puede configurar de forma gratuita y, a continuación, puedes iniciar sesión utilizando el dominio en Google Search Console (GSC). Para ello, tendrás que identificarte y dar la información necesaria acerca de tu dominio. El procedimiento viene muy bien explicado por Google. Una vez confirmada la propiedad, se puede presentar directamente una (o más) Sitemaps. Ve a la opción de menú «Crawling» y seleccione «sitemaps»…
… a continuación, llegarás al apartado de sitemaps.
En la imagen, el mapa del sitio ya está almacenado, es un índice del sitio. Como se puede ver en el gráfico, cada una es una parte de las URLs presentadas en el índice de Google – para ambas direcciones URL, así como imágenes. Google ofrece aquí otro servicio, ya que muestra los errores o advertencias cuando Google tiene problemas para rastrear los sitemaps. Estos también se describen en más detalle haciendo clic en el enlace, en el botón rojo en la parte superior derecha se pueden presentar más Sitemaps.
Conclusión
Crear un mapar del sito o sitemap no es obligatorio para páginas web pequeñas o manejables.Sin embargo, para los sitios más grandes, como grandes tiendas online sí son aconsejables. Cabe señalar que un mapa del sitio no debe contener más de 50.000 URL. Con el sitemap se pueden transmitir importantes metadatos al motor de búsqueda para explicarle así al rastreador la estructura de la página. Este no siempre es necesario y la declaración de Google es que esto no perjudica de ninguna manera. En todo caso se ancoseja siempre incluir el sitemap creado en la Google Search Console.