Categorías
Tutoriales sobre Screaming Frog

Cómo auditar y validar páginas móviles aceleradas (AMP) con Screaming Frog



Cómo auditar AMP usando Screaming Frog

Este tutorial lo guía a través de cómo puede usar el Screaming Frog para auditar páginas móviles aceleradas (AMP) de forma rápida y eficiente. Screaming Frog utiliza el Validador de AMP oficial para permitir la validación masiva de direcciones URL.

Para comenzar, deberá descargar el araña SEO que es gratis en formato lite, para hasta 500 URL. Puede descargar a través de los botones en la barra lateral derecha. El rastreo de URL de AMP a través de la etiqueta de enlace rel=”amphtml” requiere acceso de pago. Sin embargo, puede cargar un lista de URL de AMP en la versión gratuita y analizarlos y validarlos también.

Screaming Frog encontrará URL de AMP, informará sobre problemas comunes de SEO y los validará al verificar el marcado HTML requerido, los elementos HTML prohibidos según las especificaciones y más.

Tiene dos opciones para analizar y validar AMP, que puede saltar a la sección correspondiente haciendo clic en su preferencia a continuación:

  1. Rastrear un sitio para auditar AMP
  2. Cargar y auditar las URL de AMP por separado

Rastrear un sitio para auditar AMP

Esta sección de la guía muestra cómo configurar un rastreo para descubrir URL de AMP, auditarlas y validarlas.

1) Habilite ‘Rastrear’ y ‘Almacenar’ AMP en ‘Configuración> Araña> Rastrear’

Configuración de AMP

2) Rastrear el sitio web

Abra Screaming Frog, escriba o copie el sitio web que desea rastrear en el cuadro ‘ingresar url a spider’ y presione ‘Iniciar’.

Se rastreará el sitio web y se descubrirán las URL de AMP a través de cualquier etiqueta de enlace rel=”amphtml” dentro del HTML. Espere hasta que finalice el rastreo y alcance el 100 %.

3) Ver la pestaña AMP

los Pestaña AMP mostrará cualquier URL de AMP descubierta. Tiene 17 filtros (como se muestra en la imagen a continuación) que lo ayudan a identificar problemas comunes de SEO o validación.

Pestaña AMP

15 de los filtros están disponibles para verlos inmediatamente durante o al final de un rastreo. Sin embargo, un par de filtros requieren un cálculo al final del rastreo a través de la publicación ‘Análisis de rastreo‘ para que se llenen con datos (más sobre esto en un momento).

El panel «descripción general» de la derecha muestra el mensaje «(Análisis de rastreo requerido)» contra los filtros que requieren un análisis posterior al rastreo para completarse con datos.

Filtros de pestañas AMP

4) Haga clic en ‘Análisis de rastreo> Iniciar’ para completar los filtros AMP

Para completar estos dos filtros AMP, simplemente debe hacer clic en un botón para comenzar análisis de rastreo.

Iniciar análisis de rastreo

Sin embargo, si configuró ‘Análisis de rastreo’ anteriormente, es posible que desee volver a verificar, en ‘Análisis de rastreo> Configurar’, que ‘AMP’ esté marcado.

También puede desmarcar otros elementos que también requieren un análisis posterior al rastreo para que este paso sea más rápido.

Análisis posterior al rastreo para AMP

Cuando el análisis de rastreo se haya completado, la barra de progreso de ‘análisis’ estará al 100 % y los filtros ya no tendrán el mensaje ‘(Análisis de rastreo requerido)’.

Filtros AMP poblados

5) Haga clic en ‘AMP’ y vea los filtros poblados

Después de realizar un análisis posterior al rastreo, todos los filtros de AMP ahora se completarán con datos cuando corresponda. En el siguiente ejemplo, algunas de las URL de AMP son «respuestas que no son 200», que en este caso son errores 404.

URL de AMP sin respuesta 200

Puede filtrar por los siguientes elementos relacionados con SEO:

  • Respuesta no 200 – Las URL de AMP no responden con un código de estado 200 ‘OK’. Estos incluirán URL bloqueadas por robots.txt, sin respuestas, redireccionamientos, errores de cliente y servidor.
  • Falta el enlace de retorno que no es de AMP – La versión canónica que no es de AMP de la URL no contiene una URL rel=”amphtml” que vuelva a la URL de AMP. Esto podría simplemente faltar en la versión que no es de AMP, o podría haber un problema de configuración con el canónico de AMP.
  • Missing Canonical a Non-AMP – El canon de las URL de AMP no va a una versión que no sea de AMP, sino a otra URL de AMP.
  • Canónico no indexable – La URL canónica de AMP es una página no indexable. Generalmente, el equivalente que no es de AMP debe ser una página indexable.
  • indexable – La URL de AMP es indexable. Las URL de AMP con un equivalente que no es de AMP no deben ser indexables (ya que deben tener un equivalente canónico para el equivalente que no es de AMP). Las URL de AMP independientes (sin un equivalente) deben ser indexables.
  • No indexable – La URL de AMP no es indexable. Esto generalmente se debe a que están canonicalizados correctamente al equivalente que no es AMP.

Los siguientes filtros ayudan a identificar problemas comunes relacionados con especificaciones de amplificador. Screaming Frog utiliza el validador de AMP oficial para validar las URL de AMP.

  • Falta la etiqueta HTML AMP – Los documentos HTML de AMP deben contener una etiqueta HTML de nivel superior o HTML AMP.
  • Etiqueta HTML de tipo de documento faltante o no válida – Los documentos HTML de AMP deben comenzar con doctype, doctype HTML.
  • Falta la etiqueta de la cabeza – Los documentos HTML de AMP deben contener etiquetas de encabezado (son opcionales en HTML).
  • Etiqueta de cuerpo faltante – Los documentos HTML de AMP deben contener etiquetas de cuerpo (son opcionales en HTML).
  • Canónico faltante – Las URL de AMP deben contener una etiqueta canónica dentro de su encabezado que apunte a la versión HTML normal del documento HTML de AMP, o a sí mismo si no existe dicha versión HTML.
  • Etiqueta Meta Charset faltante/no válida – Los documentos HTML de AMP deben contener una etiqueta meta charset=”utf-8″ como el primer hijo de su etiqueta principal.
  • Falta la etiqueta Meta Viewport/no es válida – Los documentos HTML de AMP deben contener una etiqueta meta name=”viewport” content=”width=device-width,minimum-scale=1″ dentro de su etiqueta principal. También se recomienda incluir initial-scale=1.
  • Script de AMP faltante o no válido – Los documentos HTML de AMP deben contener una etiqueta script async src=”https://cdn.ampproject.org/v0.js” dentro de su etiqueta principal.
  • Modelo de AMP faltante/no válido – Los documentos HTML de AMP deben contener el código repetitivo de AMP en su etiqueta principal.
  • Contiene HTML no permitido – Esto marca cualquier URL de AMP con HTML no permitido para AMP. Si desea conocer el código HTML no permitido exacto, haga clic con el botón derecho en la URL y luego seleccione ‘Validación > Validador de AMP’. Esto lo abrirá en el oficial https://validator.ampproject.org/ para ver problemas específicos.
  • Otros errores de validación – Esto marca cualquier URL de AMP con otros errores de validación que no hayan sido cubiertos por los filtros anteriores.

6) Ver la fuente de URL de AMP haciendo clic en ‘Enlaces’

Si se produce un error en una URL de AMP, querrá saber el origen de esos errores. Para hacer esto, simplemente haga clic en una URL en el panel superior de la ventana y luego haga clic en la pestaña ‘Inlinks’ en la parte inferior para llenar el panel inferior de la ventana.

Las del tipo ‘amphtml’ son referencias a una URL desde etiquetas de enlace rel=”amphtml” dentro del encabezado del HTML.

Enlaces de URL de AMP

Aquí hay una vista de cerca de la pestaña de la ventana inferior ‘enlaces’:

Acercamiento de enlaces internos de URL de AMP

Esto muestra que la URL del escritorio (https://www.telegraph.co.uk/business/essential-insights/cyber-resilience/) tiene una etiqueta de enlace rel=”amphtml” a la versión AMP (https://www. telegraph.co.uk/business/essential-insights/cyber-resilience/amp/), que es un error 404.

7) Use las exportaciones ‘Exportación masiva> AMP> X Inlinks’

Para exportar datos de enlace de AMP de forma masiva, utilice el menú de nivel superior «exportación masiva > AMP».

Enlaces de entrada de AMP de exportación masiva

En la captura de pantalla anterior, esto exportaría todas las URL de AMP que no responden con un código de respuesta ‘200’ y los enlaces internos respectivos (las páginas de origen que enlazan con los 404).

Cargar y auditar las URL de AMP por separado

Alternativamente, puede auditar las URL de AMP por separado, cargándolas directamente en modo de lista. Es posible rastrear y auditar solo las URL de AMP cargándolas directamente en modo de lista y rastreándolas.

Sin embargo, si ambos existen, generalmente recomendamos auditar los equivalentes de escritorio y AMP juntos, lo cual es posible al cargar las versiones de escritorio y ajustar la configuración. Este proceso se describe a continuación.

1) Haga clic en ‘Modo > Lista’

A través del menú de nivel superior. Esto le permite cargar una lista de URL de escritorio.

Modo de lista

2) Deshabilite el límite de profundidad de rastreo en ‘Configuración> Araña> Límites’

De forma predeterminada, la profundidad de rastreo se establece en ‘0’ en el modo de lista, por lo que solo se rastrean las URL que carga. Sin embargo, esto debe eliminarse, ya que las versiones de AMP (a la profundidad de rastreo ‘1’) también deben rastrearse.

Configuración de profundidad de rastreo

3) Habilite ‘Rastrear’ y ‘Almacenar’ AMP en ‘Configuración> Araña> Rastrear’ y deshabilite todos los demás recursos y enlaces de página

En el modo de lista con la profundidad de rastreo eliminada, SScreaming Frog rastreará todas las URL cargadas y cualquier URL a la que se vinculen en adelante, como en el modo ‘Spider’ normal. Por lo tanto, para rastrear solo los equivalentes de AMP y no otros enlaces internos, todos los enlaces de páginas y recursos deben estar deshabilitados, excepto los enlaces de AMP.

Con los ‘hipervínculos internos’ y otros tipos de enlaces deshabilitados, esto significará que las URL de escritorio se cargarán y sus enlaces AMP solo se rastrearán.

4) Copie las URL de escritorio, luego haga clic en ‘Cargar> Pegar’

Esto los carga en Screaming Frog para que puedan ser rastreados.

Pegue las URL de AMP para rastrearlas

Haga clic en ‘Aceptar’ dos veces y rastree el escritorio y las URL de AMP hasta que finalice el rastreo.

5) Siga el proceso descrito en el punto 3 de la guía anterior

Ahora puede seguir el mismo proceso descrito en punto 3 en la sección «Rastrear un sitio para verificar AMP» arriba. Esto incluye ejecutar un análisis de rastreo al final de un rastreo para completar los filtros dentro de la pestaña AMP.

Si bien un rastreo en modo de lista obviamente no es tan completo como un rastreo completo de un sitio web, al cargar las URL del escritorio y rastrear sus equivalentes de AMP, Screaming Frog analizará las relaciones de origen. Por lo tanto, esta es una excelente manera de detectar rápidamente AMP.

Soporte adicional

La guía anterior debería ayudar a ilustrar los sencillos pasos necesarios para realizar una auditoría masiva y validar las páginas aceleradas móviles (AMP) en un sitio web.

Si tiene más consultas, simplemente póngase en contacto a través de apoyo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *