Categorías
Artículos sobre Screaming Frog

Cómo rastrear un sitio grande y extraer datos usando SEO Spider de Screaming Frog



A medida que las grandes empresas utilizan soluciones empresariales como esta, es como una telaraña que se entreteje en procesos y plataformas a lo largo de los años… hasta el punto en que las empresas ni siquiera son conscientes de cada punto de contacto.

Con una plataforma de automatización de marketing empresarial como Marketo, los formularios son el punto de entrada de datos en todos los sitios y páginas de destino. Las empresas suelen tener miles de páginas y cientos de formularios en sus sitios que deben identificarse para actualizarlos.

Una gran herramienta para esto es La araña SEO de Screaming Frog… quizás la plataforma más popular del mercado para rastrear, auditar y extraer datos de un sitio. La plataforma tiene muchas funciones y ofrece cientos de opciones para prácticamente todas las tareas que necesita.

Screaming Frog SEO Spider: Rastrear y extraer

Una característica clave de Screaming Frog SEO Spider es que puede realizar extracciones personalizadas basadas en expresión regular, XPath o Ruta CSS con detalles específicos. Esto es extremadamente útil ya que deseamos rastrear los sitios del cliente y auditar y capturar los valores MunchkinID y FormId de las páginas.

Con la herramienta, abre Configuración > Personalizado > Extracción para identificar los elementos que desea extraer.

La pantalla de extracción permite una recopilación de datos prácticamente ilimitada:

Reglas de extracción de Screaming Frog SEO Spider

Extracción de expresiones regulares, XPath y CSSPath

Para MunchkinID, el identificador se encuentra dentro del script de formulario que está dentro de la página:

<script type="text/javascript" id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https://yoursite.com/wp-admin/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Luego aplicamos un regla de expresiones regulares para capturar la identificación desde dentro de la etiqueta del script que se inserta en la página:

Regex: ["']id["']: *["'](.*?)["']

Para el ID de formulario, los datos están en una etiqueta de entrada dentro del formulario de Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aplicamos un regla XPath para capturar la identificación desde el formulario que se inserta en la página. La consulta XPath busca un formulario con una entrada con un nombre de formidableentonces la extracción guarda el valor:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Araña Javascript Representación

Otra gran opción de Screaming Frog es que no está limitado al HTML en la página, puede representar cualquier JavaScript que insertará formularios dentro de su sitio. Dentro de Configuración > Arañapuede ir a la pestaña Representación y habilitar esto.

Screaming Frog SEO Araña Javascript Representación

Esto lleva un poco más de tiempo para rastrear el sitio, por supuesto, pero obtendrá formularios que se procesan en el lado del cliente mediante JavaScript, así como formularios que se insertan en el lado del servidor.

Si bien esta es una aplicación muy específica, es increíblemente útil cuando trabaja con sitios grandes. Definitivamente querrá auditar dónde están incrustados sus formularios en todo el sitio.

Descargar Screaming Frog SEO Spider

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada.