Categorías
Tutoriales sobre Screaming Frog

Generador de sitemap XML con Screaming Frog



Cómo crear un mapa del sitio XML usando Screaming Frog

Este tutorial lo guía a través de cómo puede usar el Screaming Frog para generar Sitemaps XML. Para comenzar, deberá descargar la rana SEO que es gratis en formato lite, para hasta 500 URL. Puede descargar a través de los botones en la barra lateral derecha.

Si desea rastrear más de 500 URL, puede comprar una licencia anual que elimina el límite de rastreo y abre las opciones de configuración.

Los siguientes pasos para crear un Sitemap XML son los siguientes:


1) Rastrear el sitio web

Abra Screaming Frog, escriba o copie el sitio web que desea rastrear en el cuadro ‘ingresar url a spider’ y presione ‘Iniciar’.


2) Haga clic en ‘Mapas del sitio > Mapa del sitio XML’

Cuando el rastreo haya alcanzado el 100 % y haya finalizado, haga clic en la opción ‘Mapa del sitio XML’ en ‘Mapas del sitio’ en el menú de nivel superior.

Crear un mapa del sitio XML

Esto abrirá una serie de opciones de configuración del mapa del sitio


3) Seleccione ‘Páginas’ para incluir

Solo las páginas HTML incluidas en la pestaña ‘interna’ con una respuesta ‘200’ OK del rastreo se incluirán en el mapa del sitio XML de manera predeterminada. Por lo tanto, no debe preocuparse por los redireccionamientos (3XX), los errores del lado del cliente (errores 4XX, como enlaces rotos) o errores del servidor (5XX) incluidos en el mapa del sitio. Sin embargo, puede seleccionar incluirlos opcionalmente, ya que en algunos escenarios puede necesitarlos.

Las páginas que están bloqueadas por robots.txt, configuradas como ‘noindex’, han sido ‘canonicalizadas’ (la URL canónica es diferente a la URL de la página), paginadas (URL con rel=“anterior”) o PDF tampoco lo están. incluido de serie. Todo esto se puede ajustar dentro de la configuración de las ‘páginas’ del mapa del sitio XML, así que simplemente seleccione su preferencia.

Páginas para incluir en el mapa del sitio XML

Puede ver qué URL no tienen respuesta, están bloqueadas, redireccionadas o con error en la pestaña ‘Respuestas’ y usando los filtros respectivos. Puede ver qué URL son ‘noindex’, ‘canonicalized’ o tienen un elemento de enlace rel=“prev” en la pestaña ‘Directives’ y también usando los filtros.

Directivas para el mapa del sitio XML


4) Excluir páginas del mapa del sitio XML

Fuera de las opciones de configuración anteriores, puede haber páginas de respuesta HTML 200 ‘internas’ adicionales que simplemente no desea incluir en el mapa del sitio XML.

Eliminar páginas del mapa del sitio XML

Por ejemplo, no debe incluir páginas «duplicadas» dentro de un mapa del sitio. Si se puede acceder a una página mediante dos URL diferentes, por ejemplo, http://example.com y http://www.example.com (y ambas se resuelven con una respuesta ‘200’), entonces solo una única versión canónica preferida debe incluirse en el mapa del sitio. No debe incluir direcciones URL con ID de sesión (puede usar el reescritura de URL característica para eliminarlos durante un rastreo), puede haber algunas URL con muchos parámetros que no son necesarios, o solo secciones de un sitio web que no son necesarias.

Hay algunas formas de asegurarse de que no se incluyan en el mapa del sitio XML:

  • Si hay secciones del sitio web o rutas URL que no desea incluir en el mapa del sitio XML, simplemente puede excluir en la configuración previa al rastreo. Como no se rastrearán, no se incluirán en la pestaña ‘interna’ ni en el Sitemap XML.
  • Si ya ha rastreado las URL que no desea incluir en la exportación del mapa del sitio XML, simplemente resáltelas en la ‘pestaña interna’ en el panel superior de la ventana, haga clic con el botón derecho y ‘elimínelas’ antes de crear el mapa del sitio XML.
  • Alternativamente, puede exportar la pestaña ‘interna’ a Excel, filtrar y eliminar cualquier URL que no sea necesaria y volver a cargar el archivo en modo de listaantes de generar el mapa del sitio XML.

5) Elija la última fecha de modificación

Este es un atributo completamente opcional para incluir dentro de un mapa del sitio XML, por lo que puede ‘desmarcar’ la casilla ‘incluir la etiqueta lastmod’ si no desea incluir la fecha de la última modificación del archivo. Es solo una pista para los motores de búsqueda sobre cuándo se actualizó la página por última vez.

Mapa del sitio XML Lastmod

Si desea incluir el ‘último mod’, simplemente seleccione si desea usar la respuesta de ‘última modificación’ proporcionada directamente desde su servidor (y que se ve en la columna ‘Última modificación’ en la pestaña ‘Interno’) o usar una fecha personalizada.


6) Seleccione la ‘Prioridad’ de las URL

‘Prioridad’ es un atributo opcional para incluir en un Sitemap XML. Puede ‘desmarcar’ la casilla ‘incluir etiqueta de prioridad’, si no desea establecer la prioridad de las URL. La prioridad proporciona una pista a los motores de búsqueda sobre la importancia de una URL en relación con otras URL en su sitio. Los valores válidos van desde 0,0 hasta la prioridad más alta de 1,0, con el valor predeterminado en 0,5.

atributo de prioridad en el mapa del sitio xml

Screaming Frog le permite configurarlos según el «nivel» (la profundidad) de las URL. Puede ver el ‘nivel’ de las URL en la columna ‘nivel’ en la pestaña ‘Interno’.

Como se muestra en la captura de pantalla anterior, de forma predeterminada, la página de inicio (o la página de inicio del rastreo) se establece en la prioridad más alta de ‘1’, descendiendo en 0,1 en prioridad por cada nivel de profundidad hasta 0,5 para el nivel 5+. Estos se pueden ajustar a su propia preferencia.

Recuerde, la ‘prioridad’ de las URL no influirá en cómo se puntúan en los motores de búsqueda. La ‘prioridad’ se utiliza para aumentar la probabilidad de que se rastreen e indexen las páginas más importantes. En realidad, Google hace un muy buen trabajo al resolver esto algorítmicamente.


7) Seleccione la ‘Frecuencia de cambio’ de las URL

El ‘changefreq’ es otro atributo opcional que ‘sugiere’ la frecuencia con la que es probable que cambie la página.

Screaming Frog le permite configurarlos en función de la respuesta de «última modificación» o el «nivel» (profundidad) de las URL. La opción ‘calcular desde el último encabezado modificado’ significa que si la página se ha cambiado en las últimas 24 horas, se configurará como ‘diariamente’, si no, se configurará como ‘mensual’.

Frecuencia de cambio del mapa del sitio XML

Por favor, recuerde, estos no son comandos para los motores de búsqueda, simplemente ‘sugerencias’. Básicamente, Google rastreará una URL con la frecuencia que determine algorítmicamente, sobre cualquier «pista» proporcionada por usted en el mapa del sitio XML.


8) Seleccionar imágenes para incluir en el mapa del sitio

Es totalmente opcional incluir imágenes en un mapa del sitio XML. Si la opción ‘incluir imágenes’ está marcada, todas las imágenes de la pestaña ‘Interno’ (y la pestaña ‘Imágenes’) se incluirán de forma predeterminada. Si sus imágenes están en un CDN, subdominio o residen externamente, aparecerán en la pestaña ‘externa’ dentro de la interfaz de usuario. Puede ingresar expresiones regulares en la configuración para incluirlas en el mapa del sitio XML.

Generador de mapa de sitio XML de imagen

Por lo general, no necesita incluir imágenes como su propio logotipo, espaciadores o íconos de perfil de redes sociales dentro del mapa del sitio XML, por lo que puede seleccionar incluir solo imágenes con una cierta cantidad de referencias de atributos de origen para excluirlas.

A menudo, las imágenes como los logotipos están vinculadas a todo el sitio, mientras que las imágenes en las páginas de productos como ejemplo, que generalmente desea incluir, pueden vincularse solo una o dos veces. Hay una columna ‘IMG Inlinks’ en la pestaña ‘imágenes’ que muestra cuántas veces se hace referencia a una imagen para ayudar a ajustar la cantidad de ‘inlinks’ que podrían ser adecuados para su inclusión.

Eliminar imágenes de todo el sitio Mapa del sitio XML

También puede hacer clic con el botón derecho y ‘eliminar’ cualquier imagen que no desee incluir, de la misma manera que cualquier otra URL.


9) Incluir hreflang

Si ya tiene configurado hreflang en el sitio, ya sea mediante atributos o encabezado HTTP, puede seleccionar agregar hreflang en el mapa del sitio XML.

Mapa del sitio XML Hreflang

Tenga en cuenta: Screaming Frog solo puede crear mapas de sitio XML con hreflang si ya están presentes actualmente (como atributos o a través del encabezado HTTP).


10) Haga clic en ‘Siguiente’ para generar el mapa del sitio XML

Cuando haya terminado de configurar los diversos atributos y opciones del mapa del sitio, simplemente haga clic en ‘siguiente’ para crear el mapa del sitio XML. Un archivo de mapa del sitio no puede contener más de 50 000 URL y no debe tener más de 50 MB sin comprimir. Por lo tanto, si tiene más de 49 999 URL, la araña de SEO creará automáticamente archivos de mapas de sitios adicionales y un archivo de índice de mapas de sitios que haga referencia a las ubicaciones de los mapas de sitios.

Crear mapa del sitio XML

Luego haga clic en ‘guardar’ en su ubicación preferida en su máquina. Si bien esos son todos los pasos necesarios para crear el mapa del sitio XML, ¡hay un par de pasos más que recomendamos después!


Envíe su mapa del sitio XML a Google

El mapa del sitio XML ahora está listo para enviarse a los motores de búsqueda. Recomendamos encarecidamente enviar el mapa del sitio XML a Google a través de Herramientas para webmasters como una forma de rastrear la indexación.

Enviar mapa del sitio XML a Google

Finalmente, recomendamos incluir la siguiente entrada de línea en cualquier lugar dentro de su archivo robots.txt, para informar a los motores de búsqueda de la existencia de los Sitemaps XML (independientemente de que ya lo haya enviado a las Herramientas para webmasters de Google):

Mapa del sitio: http://www.example.com/sitemap.xml


Automatización de mapas de sitio XML

Esta guía le muestra cómo crear manualmente un mapa del sitio XML, lo que incluye configurar y ejecutar un rastreo, exportar el mapa del sitio XML y luego cargarlo en el servidor. Sin embargo, este proceso se puede automatizar para mayor eficiencia.

¿Cuáles son los pasos para automatizar sus mapas de sitio XML?

  • Configuración de su rastreo automático
  • Establecer una ubicación central para almacenar archivos de salida de SF
  • Creando el proxy inverso
  • Pruebas

Echa un vistazo a nuestro Automatización de mapas de sitio XML con Screaming Frog entrada de blog para la inspiración.


Resumen

¡Eso es todo! Esperemos que la guía anterior ayude a ilustrar cómo utilizar el software Screaming Frog para generar un Sitemap XML de Google para su sitio web.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.