Cómo auditar mapas de sitio XML utilizando SEO Spider
Los sitemaps XML deben estar actualizados, sin errores e incluir versiones canónicas e indexables de URL para ayudar a los motores de búsqueda a rastrear e indexar las URL que son importantes para un sitio web.
Este tutorial lo guía a través de cómo puede usar Screaming Frog para auditar mapas de sitios XML, ya sea rastreándolos como parte del rastreo de un sitio, o cargándolos por separado y rastreando las URL de los mapas de sitios XML.
Para comenzar, deberá descargar Screaming Frog que es gratis en formato lite, para rastrear hasta 500 URL. Puede descargar a través de los botones en la barra lateral derecha. Rastrear un mapa del sitio como parte de un rastreo requiere acceso pago, sin embargo, puede cargar y analizar un mapa del sitio XML en modo de lista usando la versión gratuita.
La ventaja de auditar un mapa del sitio XML como parte de un rastreo del sitio es que puede hacer coincidir el contenido de un rastreo con el mapa del sitio XML para descubrir URL huérfanas (URL en el mapa del sitio XML, pero no vinculadas internamente en el sitio), o URL encontradas en un rastreo, pero que faltan en el mapa del sitio XML.
Cargar un mapa del sitio XML por separado significa que no tendrá datos sobre las URL que podrían faltar en un rastreo o URL huérfanas. Puede pasar a la sección correspondiente de este tutorial haciendo clic en su preferencia a continuación:
Rastrear un sitio y auditar mapas de sitio XML
Esta sección de la guía muestra cómo configurar un rastreo que también integra las URL del mapa del sitio XML.
1) Seleccione ‘Rastrear mapas de sitio XML vinculados’ en ‘Configuración > Araña > Rastrear’
Puede elegir descubrir los Sitemaps XML a través de robots.txt (esto requiere una entrada ‘Sitemap: https://www.example.com/sitemap.xml) o proporcionar el destino del Sitemap XML.
2) Rastrear el sitio web
Abra SEO Spider, escriba o copie el sitio web que desea rastrear en el cuadro ‘ingresar url a spider’ y presione ‘Iniciar’.
El sitio web y los Sitemaps XML serán posteriormente rastreados. Espere hasta que finalice el rastreo y alcance el 100 %.
3) Ver la pestaña Mapas del sitio
los Pestaña Mapas del sitio tiene 7 filtros en total que ayudan a agrupar los datos por tipo e identificar problemas comunes con los mapas de sitio XML.
Solo dos de los filtros están disponibles para ver en tiempo real durante un rastreo. Cinco filtros requieren cálculo al final del rastreo a través de la publicación ‘Análisis de rastreo‘ para que se llenen con datos (más sobre esto en un momento).
El panel «descripción general» de la derecha muestra el mensaje «(Análisis de rastreo requerido)» contra los filtros que requieren un análisis posterior al rastreo para completarse con datos.
SEO Spider solo sabrá qué URL faltan en un mapa del sitio XML y viceversa, cuando se complete todo el rastreo.
4) Haga clic en ‘Análisis de rastreo > Iniciar’ para completar los filtros del mapa del sitio
Para completar estos cinco filtros del mapa del sitio, simplemente debe hacer clic en un botón.
Sin embargo, si configuró ‘Análisis de rastreo’ anteriormente, es posible que desee volver a verificar, en ‘Análisis de rastreo> Configurar’, que ‘Sitemaps’ esté marcado.
También puede desmarcar otros elementos que también requieren un análisis posterior al rastreo para que este paso sea más rápido.
Cuando el análisis de rastreo se haya completado, la barra de progreso de ‘análisis’ estará al 100 % y los filtros ya no tendrán el mensaje ‘(Análisis de rastreo requerido)’.
Ahora puede ver los filtros poblados.
5) Haga clic en ‘Sitemaps’ y vea los filtros
Después de realizar un análisis posterior al rastreo, todos los filtros del mapa del sitio ahora se completarán con datos cuando corresponda.
Puede filtrar por lo siguiente:
- URL en el mapa del sitio – Todas las URL que se encuentran en un Sitemap XML. Esto debe contener versiones indexables y canónicas de URL importantes.
- URL que no están en el mapa del sitio – URL que no están en un mapa del sitio XML, pero que se descubrieron en el rastreo. Esto puede ser a propósito (ya que no son importantes), o pueden faltar, y el mapa del sitio XML debe actualizarse para incluirlos. Este filtro no tiene en cuenta las URL no indexables, asume que son correctamente no indexables y, por lo tanto, no deben marcarse para incluirse.
- URL huérfanas – URL que solo están en un mapa del sitio XML, pero que no se descubrieron durante el rastreo. O URL que solo se descubren a partir de URL en el mapa del sitio XML, pero que no se encontraron en el rastreo. Estos pueden incluirse accidentalmente en el mapa del sitio XML, o pueden ser páginas que desea indexar y deberían vincularse internamente.
- URL no indexables en Sitemap – URL que están en un mapa del sitio XML, pero que no son indexables y, por lo tanto, deben eliminarse o debe corregirse su indexabilidad.
- URL en varios sitemaps – URLs que están en más de un Sitemap XML. Esto no es necesariamente un problema, pero generalmente una URL solo debe estar en un único mapa del sitio XML.
- Mapa del sitio XML con más de 50k URL – Esto muestra cualquier Sitemap XML que tenga más de las 50k URL permitidas.
- Mapa del sitio XML con más de 50 MB – Esto muestra cualquier mapa del sitio XML que sea más grande que el tamaño de archivo permitido de 50 mb.
Los filtros anteriores lo ayudarán a revisar que solo sus URL canónicas e indexables estén incluidas en el mapa del sitio XML.
Bing tiene poca tolerancia a la «suciedad» en los Sitemaps XML, como aquellos que contienen errores, redireccionamientos o URL no indexables, lo que puede significar que confían menos en el Sitemap XML para rastrear e indexar.
Google también recomienda usar Sitemaps XML para ayudar con la canonicalización de las URL (definir la versión preferida de las URL), por lo que es importante mantenerlas en buen estado y brindar señales claras y consistentes.
Consulte más información sobre los mapas de sitio XML en Sitemaps.org y Ayuda de la consola de búsqueda de Google.
6) Ver la fuente del mapa del sitio XML haciendo clic en ‘Enlaces’
Si tiene varios mapas de sitio XML, querrá saber cuál de los mapas de sitio XML contiene una URL no indexable, una URL huérfana, etc.
Para hacer esto, simplemente haga clic en una URL en el panel superior de la ventana y luego haga clic en la pestaña ‘Inlinks’ en la parte inferior para llenar el panel inferior de la ventana. Los del tipo ‘XML Sitemap’, son referencias a una URL desde un XML Sitemap.
Aquí hay una vista de cerca de la pestaña de la ventana inferior ‘enlaces’:
En este ejemplo, el /descargo de responsabilidad/ está en /sitemap.xml.
Redirige a nuestra página de /privacidad/, que debería estar allí.
7) Use las exportaciones ‘Exportación masiva> Sitemaps> X Inlinks’
Si tiene varios mapas de situación XML, este es un paso esencial, para que sepa qué URL se relacionan con qué mapas de sitio XML.
Para exportar de forma masiva los datos del vínculo del mapa del sitio XML, utilice el menú de nivel superior «Exportación masiva > Sitemaps».
En la captura de pantalla anterior, esto exportaría todos los Sitemaps XML que tienen URL no indexables dentro de ellos.
Cargar y auditar mapas de sitio XML por separado
Puede auditar un mapa del sitio XML por separado (lejos de un rastreo del sitio), cargándolo en modo de lista. Este proceso se describe a continuación.
1) Haga clic en ‘Modo > Lista’
A través del menú de nivel superior. Esto le permite cargar una lista de URL o descargar un mapa del sitio XML directamente.
2) Elija ‘Cargar un archivo’ o ‘Descargar mapa del sitio XML’
Si tiene un archivo de mapa del sitio XML guardado, es posible que desee cargar el archivo; sin embargo, si ya está activo, simplemente puede elegir ‘Descargar mapa del sitio XML’ e ingresar la URL.
Si tiene un archivo de índice de Sitemap, que contiene varios Sitemaps XML, seleccione «Descargar Sitemap XML» para rastrearlos todos de una sola vez.
Haga clic en ‘Aceptar’ y ‘Aceptar’ nuevamente para iniciar el rastreo.
3) Siga el proceso descrito en el punto 3 de la guía anterior
Ahora puede seguir el mismo proceso descrito en punto 3 en el ‘Rastrear un sitio y auditar mapas de sitio XML‘ sección anterior. Esto incluye ejecutar un análisis de rastreo al final de un rastreo para completar los filtros dentro de la pestaña Sitemaps.
Vale la pena recordar que cargar un mapa del sitio XML a través del modo de lista no será tan completo, ya que SEO Spider no tendrá datos sobre cuáles de ellos se pueden encontrar en el rastreo.
Esto significa que los filtros «URL que no están en el mapa del sitio» y «URL huérfanas» no se completarán porque no se conocen estos datos.
Soporte adicional
La guía anterior debería ayudar a ilustrar los sencillos pasos necesarios para realizar auditorías masivas de mapas de sitios XML utilizando Screaming Frog.
Si tiene más consultas sobre el proceso descrito anteriormente, simplemente póngase en contacto a través de apoyo.