Qué es un Sitemap XML

Qué es un Sitemap XML y para que sirve

En términos simples, un mapa del sitio o Sitemap XML es una lista de las URL de su sitio web. Actúa como una hoja de ruta para indicar a los motores de búsqueda qué contenido está disponible y cómo llegar a él.

[lwptoc width=”full” float=”none”]

En el ejemplo anterior, un motor de búsqueda encontrará las nueve páginas en un mapa del sitio con una visita al archivo del mapa del sitio XML. En el sitio web, tendrás que saltar a través de cinco enlaces internos para encontrar la página 9.

Esta capacidad del sitemap XML para ayudar a los rastreadores para una indexación más rápida es especialmente importante para los sitios web que:

  • Tienen miles de páginas y/o una arquitectura de sitio web profunda.
  • Agrega con frecuencia nuevas páginas.
  • Cambia con frecuencia el contenido de las páginas existentes.
  • Sufre de enlaces internos débiles y páginas huérfanas.
  • Carecen de un fuerte perfil de enlace externo.

Enviar un mapa del sitio sin URL indexadas también puede acelerar la desindexación. Esto puede ser más eficiente que eliminar las URL en Google Search Console si tiene muchas que desindexar.

Adrián Covarrubias | Web Marketing

Pero utilízalo con cuidado y asegúrate de agregar dichas URL solo temporalmente a tus mapas de sitio.

Aunque los motores de búsqueda técnicamente pueden encontrar sus URL sin él, al incluir páginas en un mapa del sitio XML, estás indicando que las considera páginas de destino de calidad.

Si bien no hay garantía de que un mapa del sitio XML haga que sus páginas sean rastreadas, y mucho menos indexadas o clasificadas, enviar uno ciertamente aumenta sus posibilidades.

Formatos de Sitemap XML

Un sitio de una página que usa todas las etiquetas disponibles tendría este mapa del sitio XML:

Pero, ¿cómo debe usar un SEO cada una de estas etiquetas? ¿Todos los metadatos son valiosos?

Etiqueta Loc (Location Tag)

Esta etiqueta obligatoria contiene la versión canónica absoluta de la ubicación de la URL. Debe reflejar con precisión el protocolo de su sitio (http o https) y si ha elegido incluir o excluir www. Para sitios web internacionales, aquí también es donde puede implementar su manejo de hreflang.

Al usar el atributo xhtml:link para indicar las variantes de idioma y región para cada URL, reduce el tiempo de carga de la página, algo que las otras implementaciones de elementos de enlace en los encabezadoso HTTP no pueden ofrecer Yoast tiene una publicación épica en hreflang para aquellos que quieran aprender más.

Etiqueta Lastmod (Last Modified Tag)

Una etiqueta opcional pero muy recomendable que se utiliza para comunicar la fecha y la hora de la última modificación del archivo.

John Mueller reconoció que Google usa los metadatos lastmod para comprender cuándo cambió la página por última vez y si debe rastrearse. Consejos contradictorios de Illyes en 2015.

La hora de la última modificación es especialmente crítica para los sitios de contenido, ya que ayuda a Google a comprender que usted es el editor original. También es poderoso para comunicar frescura, asegúrese de actualizar la fecha de modificación solo cuando haya realizado cambios significativos.

Intentar engañar a los motores de búsqueda para que su contenido sea nuevo, cuando no lo es, puede resultar en una penalización de Google.

Etiqueta Changefreq (Change Frequency Tag)

Érase una vez, esta etiqueta opcional insinuaba con qué frecuencia se esperaba que el contenido de la URL cambiara a los motores de búsqueda.
Pero Mueller ha declarado que “la frecuencia de cambio realmente no juega un papel tan importante con los mapas de sitio” y que “es mucho mejor especificar la marca de tiempo directamente”.

Etiqueta de prioridad (Priority Tag)

Esta etiqueta opcional que aparentemente le dice a los motores de búsqueda qué tan importante es una página en relación con sus otras URL en una escala de 0.0 a 1.0.
En el mejor de los casos, solo fue una pista para los motores de búsqueda y tanto Mueller como Illyes han declarado claramente que la ignoran.

Tu sitio web necesita un mapa del sitio XML, pero no necesariamente los metadatos de prioridad y frecuencia de cambio. Utiliza las etiquetas lastmod con precisión y concentra tu atención en asegurarte de haber enviado las URL correctas.

Tipos de Sitemaps

Existen diferentes tipos de mapas de sitio. Veamos los que realmente necesita.

XML Sitemap Index

Los mapas de sitio XML tienen un par de limitaciones:
– Un máximo de 50.000 URL.
– Un límite de tamaño de archivo sin comprimir de 50 MB.

Los sitemaps se pueden comprimir usando gzip (el nombre del archivo sería algo similar a sitemap.xml.gz) para ahorrar ancho de banda para su servidor. Pero una vez descomprimido, el mapa del sitio aún no puede exceder ninguno de los límites.

Cada vez que excedas cualquiera de los límites, deberás dividir sus URL en varios mapas de sitio XML.

Esos mapas de sitio se pueden combinar en un solo archivo de índice de mapa de sitio XML, a menudo llamado sitemap-index.xml. Esencialmente, un mapa de sitio para mapas de sitio.

Para sitios web excepcionalmente grandes que deseen adoptar un enfoque más granular, también puede crear varios archivos de índice de mapa de sitio.

Por ejemplo:
sitemap-index-articles.xml
sitemap-index-productos.xml
sitemap-index-categories.xml

Pero ten en cuenta que no puede anidar archivos de índice de mapa de sitio.

Para que los motores de búsqueda encuentren fácilmente cada uno de los archivos de su mapa del sitio a la vez, querrá:
– Envía los índices de su mapa del sitio a Google Search Console y Bing Webmaster Tools.
– Especifica la(s) URL(s) del índice de su mapa del sitio en su archivo robots.txt. Apuntando a los motores de búsqueda directamente a su mapa del sitio mientras les da la bienvenida para rastrear.

También puedes enviar mapas de sitio haciéndolos ping a Google.

Sitemap Google Search Console

XML Image Sitemap

Los sitemaps de imágenes se diseñaron para mejorar la indexación del contenido de las imágenes.
Sin embargo, en el SEO moderno, las imágenes están incrustadas en el contenido de la página, por lo que se rastrearán junto con la URL de la página.

Además, es una buena práctica utilizar el marcado JSON-LD schema.org/ImageObject para llamar las propiedades de la imagen a los motores de búsqueda, ya que proporciona más atributos que un mapa del sitio XML de imagen.

Debido a esto, un mapa del sitio de imagen XML es innecesario para la mayoría de los sitios web. Incluir un mapa del sitio de imágenes solo desperdiciaría el presupuesto de rastreo.

La excepción a esto es si las imágenes ayudan a impulsar su negocio, como un sitio web de fotos de archivo o un sitio de comercio electrónico que obtiene sesiones de página de productos de la búsqueda de imágenes de Google.
Sepa que las imágenes no tienen que estar en el mismo dominio que su sitio web para enviarse en un mapa del sitio. Puede usar un CDN siempre que esté verificado en Search Console.

XML Video Sitemap

Al igual que con las imágenes, si los videos son críticos para su negocio, envíe un mapa del sitio de video XML. De lo contrario, no es necesario un mapa del sitio de video. Guarde su presupuesto de rastreo para la página en la que está incrustado el video, asegurándose de marcar todos los videos con JSON-LD como schema.org/VideoObject.

Google News Sitemap

Solo los sitios registrados en Google News deben usar este mapa del sitio. Si es así, incluya artículos publicados en los últimos dos días, hasta un límite de 1000 URL por mapa del sitio, y actualice con artículos nuevos tan pronto como se publiquen. Contrariamente a algunos consejos en línea, los mapas de sitio de Google News no admiten URL de imagen.

Google recomienda usar la imagen schema.org u og:image para especificar la miniatura de su artículo para Google News.

Mobile Sitemap

Esto no es necesario para la mayoría de los sitios web. ¿Por qué? Porque Mueller confirmó que los sitemaps móviles son solo para páginas de teléfonos básicos. No para compatibilidad con teléfonos inteligentes.
Por lo tanto, a menos que tenga URL únicas diseñadas específicamente para teléfonos destacados, un mapa del sitio móvil no será de utilidad.

HTML Sitemap

Los mapas de sitio XML se encargan de las necesidades de los motores de búsqueda. Los mapas de sitio HTML se diseñaron para ayudar a los usuarios humanos a encontrar contenido. La pregunta es, si tiene una buena experiencia de usuario y enlaces internos bien elaborados, ¿necesita un mapa del sitio HTML? Verifique las visitas a la página de su mapa del sitio HTML en Google Analytics. Lo más probable es que sea muy bajo. De lo contrario, es una buena indicación de que necesita mejorar la navegación de su sitio web. Los mapas de sitio HTML generalmente están vinculados en los pies de página del sitio web. Tomando la equidad de enlace de cada página de su sitio web.

Pregúntese. ¿Es ese el mejor uso de esa equidad de enlace? ¿O está incluyendo un mapa del sitio HTML como un guiño a las mejores prácticas del sitio web heredado?
Si pocos humanos lo usan. Y los motores de búsqueda no lo necesitan, ya que tiene enlaces internos sólidos y un mapa del sitio XML. ¿Ese mapa del sitio HTML tiene una razón para existir? Yo diría que no.

Dynamic XML Sitemap

Los sitemaps estáticos son fáciles de crear usando una herramienta como Screaming Frog.

El problema es que, tan pronto como crea o elimina una página, su mapa del sitio está desactualizado. Si modifica el contenido de una página, el mapa del sitio no actualizará automáticamente la etiqueta lastmod.

Entonces, a menos que le encante crear y cargar mapas de sitio manualmente para cada cambio, es mejor evitar los mapas de sitio estáticos.

Los mapas de sitio XML dinámicos, por otro lado, son actualizados automáticamente por su servidor para reflejar los cambios relevantes del sitio web a medida que ocurren.

Para crear un mapa del sitio XML dinámico:
Pídale a su desarrollador que codifique un script personalizado, asegurándose de proporcionar especificaciones claras
Use una herramienta generadora de mapas de sitios dinámicos
Instale un complemento para su CMS, por ejemplo, el complemento Yoast SEO para WordPress

Los mapas de sitio XML dinámicos y un índice de mapa de sitio son las mejores prácticas modernas. Los sitemaps móviles y HTML no lo son.

Use mapas de sitio de imágenes, videos y Google News solo si la indexación mejorada de estos tipos de contenido impulsa sus KPI.

XML Sitemap Indexation Optimization

Ahora viene la parte divertida. ¿Cómo se utilizan los mapas de sitio XML para impulsar los KPI de SEO?

Incluir solo páginas relevantes para SEO en mapas de sitio XML
Un mapa del sitio XML es una lista de páginas que recomienda rastrear, que no son necesariamente todas las páginas de su sitio web. Una araña de búsqueda llega a su sitio web con una “concesión” de cuántas páginas rastreará.

El mapa del sitio XML indica que considera que las URL incluidas son más importantes que aquellas que no están bloqueadas pero que no están en el mapa del sitio.

Lo está utilizando para decirle a los motores de búsqueda “Realmente apreciaría si se centrara en estas URL en particular”.

Esencialmente, lo ayuda a usar el presupuesto de rastreo de manera efectiva.

Al incluir solo páginas relevantes para SEO, ayuda a los motores de búsqueda a rastrear su sitio de manera más inteligente para obtener los beneficios de una mejor indexación.

Debes excluir:

  • Páginas no canónicas.
  • Páginas duplicadas.
  • Páginas paginadas.
  • URL basadas en parámetros o ID de sesión.
  • Páginas de resultados de búsqueda del sitio.
  • Responder a URL de comentarios.
  • Compartir a través de direcciones URL de correo electrónico.
  • URL creadas por filtrado que no son necesarias para SEO.
  • Archivar páginas.
  • Cualquier redirección (3xx), páginas faltantes (4xx) o páginas de error del servidor (5xx).
  • Páginas bloqueadas por robots.txt.
  • Páginas sin índice.
  • Páginas de recursos a las que se puede acceder mediante un formulario de generación de
  • clientes potenciales (por ejemplo, documentos PDF).
  • Páginas de utilidad que son útiles para los usuarios, pero que no pretenden ser páginas de destino (página de inicio de sesión, contáctenos, política de privacidad, páginas de cuenta, etc.).

 

Quiero compartir un ejemplo sobre la priorización de páginas:

Digamos que su sitio web tiene 1.000 páginas. 475 de esas 1000 páginas son contenido relevante para SEO. Resalta esas 475 páginas en un mapa del sitio XML, esencialmente pidiéndole a Google que deje de priorizar la indexación del resto.

Ahora, digamos que Google rastrea esas 475 páginas y decide algorítmicamente que 175 son de grado “A”, 200 son “B+” y 100 “B” o “B-“.

Esa es una calificación promedio sólida y probablemente indica un sitio web de calidad al que enviar a los usuarios.

Compare eso con el envío de las 1000 páginas a través del mapa del sitio XML. Ahora, Google analiza las 1000 páginas que dice que son contenido relevante para SEO y ve que más del 50 por ciento son páginas “D” o “F”.

Tu calificación promedio ya no se ve tan bien y eso puede dañar tus sesiones orgánicas.

Pero recuerde, Google utilizará su mapa del sitio XML solo como una pista de lo que es importante en su sitio.

El hecho de que no esté en su mapa del sitio XML no significa necesariamente que Google no indexará esas páginas.

Cuando se trata de SEO, la calidad general del sitio es un factor clave.

Para evaluar la calidad de su sitio, consulte los informes relacionados con el mapa del sitio en Google Search Console (GSC).

Administre el presupuesto de rastreo limitando las URL del mapa del sitio XML solo a las páginas relevantes para SEO e invierta tiempo para reducir la cantidad de páginas de baja calidad en su sitio web.

XML Sitemap Checklist

Invierte tiempo en:

  • Comprimir archivos de mapa del sitio usando gzip
  • Usar un archivo de índice de mapa del sitio
  • Use mapas de sitio de imágenes, videos y noticias de Google solo si la indexación impulsa sus KPI
  • Genere dinámicamente mapas de sitio XML
  • Asegúrese de que las URL se incluyan solo en un solo mapa del sitio
  • Haga referencia a las URL del índice del mapa del sitio en robots.txt
  • Envíe el índice del mapa del sitio tanto a Google Search Console como a Bing
  • Herramientas para webmasters
  • Incluya solo páginas relevantes para SEO en mapas de sitio XML
  • Reparar todos los errores y advertencias
  • Analiza tendencias y tipos de páginas válidas
  • Calcular la tasa de indexación de las páginas enviadas
  • Abordar las causas de exclusión de las páginas enviadas

Ahora, revisa tu propio mapa del sitio y asegúrate de que lo estás haciendo bien.