Categorías
Tutoriales sobre Screaming Frog

Cómo usar la búsqueda personalizada de Screaming Frog



Introducción a la búsqueda personalizada

Screaming Frog le permite encontrar lo que desee en el HTML o el texto de un sitio web utilizando su función de búsqueda personalizada.

Esto puede ser útil al verificar etiquetas de análisis o descubrir qué páginas tienen ciertas palabras o frases, como una marca antigua, «agotado» o frases clave para oportunidades de enlaces internos.

Puede configurar hasta 100 filtros de búsqueda mediante la búsqueda personalizada, lo que le permite ingresar texto o expresiones regulares y encontrar páginas que ‘contienen’ o ‘no contienen’ su entrada elegida e informan la cantidad de ocurrencias.

Este tutorial lo guía a través de cómo usar la función, escenarios comunes y búsquedas más avanzadas.

Para comenzar, descargue el spider SEO que es gratuito para rastrear hasta 500 URL; sin embargo, esta función requiere un licencia paga para utilizar la búsqueda personalizada.

Enlace relativo


1) Agregar filtros de búsqueda personalizados

Haga clic en ‘Configuración > Personalizado > Buscar’ en el menú de nivel superior para abrir la configuración de búsqueda personalizada.

Búsqueda personalizada

Luego haga clic en ‘Agregar’ (en la parte inferior derecha) para configurar un filtro de búsqueda personalizado.

Agregar filtro de búsqueda personalizado

Aparecerá un filtro de búsqueda personalizado. Puede agregar hasta 100 filtros separados en un rastreo.

Filtro de búsqueda personalizado


2) Ingrese su búsqueda

Ahora ingrese su búsqueda en el cuadro ‘Ingresar consulta de búsqueda’ y ajuste cada opción de filtro de búsqueda.

De izquierda a derecha, puede nombrar el filtro de búsqueda, seleccionar ‘contiene’ o ‘no contiene’, elegir ‘texto’ o ‘regex’, ingresar su consulta de búsqueda y elegir dónde se realiza la búsqueda (HTML, texto de página, un elemento, o XPath y más).

Filtros de búsqueda personalizados

El ejemplo anterior muestra una búsqueda de «Agotado» en el texto de cualquier página y una búsqueda de cualquier página que no contenga un código de seguimiento de Google Tag Manager en el elemento de encabezado HTML de una página.

Cuando los filtros están configurados, puede hacer clic en ‘Aceptar’ y ejecutar un rastreo para realizar la búsqueda.


3) Rastrear el sitio web

Escriba o copie el sitio web que desea rastrear en el cuadro ‘Enter URL to spider’ y presione ‘Iniciar’.

Rastreo personalizado del sitio de búsqueda

Espere hasta que finalice el rastreo y alcance el 100 %, o mire en tiempo real a medida que se completan los filtros de la pestaña de búsqueda personalizada.


4) Ver datos en la pestaña de búsqueda personalizada y filtros

Haga clic en la pestaña Búsqueda personalizada para ver los resultados de su búsqueda personalizada en tiempo real. De manera predeterminada, los datos de todas las búsquedas se muestran juntos en la pestaña, pero los filtros se pueden usar para refinar los datos para mostrar solo cada filtro por separado.

Datos de resultados de búsqueda personalizados

El filtro ‘contiene’ mostrará el número de ocurrencias de la búsqueda, mientras que una búsqueda ‘no contiene’ devolverá ‘Contiene’ o ‘No contiene’.

En esta búsqueda, hay 2 páginas con el texto «Agotado», cada una de las cuales contiene la palabra solo una vez, mientras que el código GTM no se encontró en ninguna de las 10 páginas.

Estos números también se pueden ver en el panel «Descripción general» de la derecha, que actualiza los recuentos de filtros en tiempo real.

Descripción general de la mano derecha de la búsqueda personalizada


5) Exportación

Exporte datos de búsqueda personalizados haciendo clic en el botón «exportar», que funciona junto con los filtros y su vista actual.

Exportación de búsqueda personalizada

También puede exportar ‘inlinks’ (las páginas de origen que vinculan) a filtros de búsqueda personalizados a través de ‘Exportación masiva> Búsqueda personalizada> Filter X Inlinks’.

Exportación masiva de búsqueda personalizada


Opciones de filtro de búsqueda avanzada

La búsqueda personalizada puede ser realmente poderosa al combinar filtros y ajustar las configuraciones de los filtros de búsqueda. En particular, usando expresiones regulares y eligiendo dónde se realiza la búsqueda.

Sensibilidad de mayúsculas y minúsculas

Si necesita realizar una búsqueda con distinción entre mayúsculas y minúsculas, al buscar ‘texto’ puede hacer clic en las flechas a la derecha del cuadro para expandir el área de texto y elegir ‘con distinción entre mayúsculas y minúsculas’.

Sensibilidad a mayúsculas y minúsculas con búsqueda personalizada

‘Regex’ distingue entre mayúsculas y minúsculas de forma predeterminada, para que no se distinga entre mayúsculas y minúsculas, utilice (?i) antes de la palabra. Por ejemplo –

(?i)optimización

Coincidiría con ‘optimización’ y ‘OPTIMIZACIÓN’, o incluso con ‘OpTiMiSaTiOn’.

La distinción entre mayúsculas y minúsculas puede ser particularmente útil cuando se buscan errores ortográficos en nombres de marcas, acrónimos, etc.

Palabras exactas y múltiples

Puede elegir buscar usando texto regular, o para usos más avanzados puede cambiar a expresiones regulares.

Expresión regular de búsqueda personalizada

Por ejemplo, al usar expresiones regulares, puede hacer coincidir palabras exactas usando lo siguiente.

bpalabrab

Esto coincidiría con una palabra en particular (‘palabra’ en este caso), ya que b coincide con los límites de las palabras.

Esto puede ser útil al buscar palabras o frases que pueden tener otras palabras, como ‘pr’ (que aparecerán en ‘promoción’, presentación previa y más en nuestro sitio).

Sin usar límites de palabras, ‘pr’ se encuentra 12 veces en nuestra página de relaciones públicas digitales. Con una coincidencia exacta que distingue entre mayúsculas y minúsculas, en realidad es 0.

Búsqueda exacta de palabras usando regex

También puede combinar palabras en una búsqueda. Por ejemplo, si quisiera encontrar páginas con las palabras ‘natural’, ‘orgánico’ y ‘gratis’, podría combinar palabras en un solo filtro usando una tubería.

bnaturalb|borgánicob|blibreb

Esto contará cada instancia de cada una de las palabras, por ejemplo, nuestra página de ‘optimización de motor de búsqueda’ tiene ‘orgánico’ 3 veces y ‘natural’ y ‘gratis’ una vez, para hacer 5 en total.

Búsqueda personalizada de varias palabras

Puede hacer clic en el encabezado para ordenar por ocurrencias como se muestra en el ejemplo.

Combinar búsquedas

Puede combinar filtros y verlos juntos al mismo tiempo. Entonces, si desea buscar cualquier página que contenga una palabra, pero no contenga otra palabra, use varios filtros y visualícelos juntos en la pestaña de búsqueda personalizada.

Combinar filtros de búsqueda

En este ejemplo, puede ver que no hay instancias en las que no se usen las palabras «rastreador» y «mejor». ¡Esto es apropiado!

Busca en

La búsqueda personalizada comprobará el HTML sin formato o el HTML renderizado en función de su modo de renderizado. De forma predeterminada, comprobará el HTML sin formato, pero si ha configurado el modo de representación de JavaScript, comprobará el HTML representado.

Luego, puede refinar exactamente dónde se realiza la búsqueda personalizada.

Búsqueda personalizada en

Estas 7 opciones disponibles le permiten controlar dónde busca:

  • HTML – El HTML completo de la página web.
  • Texto de página – El texto de las páginas web, excluyendo cualquier HTML.
  • Texto de la página Sin anclas – El texto de las páginas web, excluyendo cualquier HTML o cualquier texto contenido dentro de las etiquetas de anclaje HTML (también conocido como Elementos A). Esto puede ser útil al buscar palabras que también se incluyen en el texto del enlace dentro de los menús, lo que puede hacer que todas las páginas se marquen para contener la búsqueda de lo contrario.
  • Encabezado HTML – El encabezado HTML de la página web.
  • Cuerpo HTML – El cuerpo HTML de la página web, que puede incluir HTML y texto de la página.
  • XPath – Puede proporcionar un XPath para especificar la ubicación en el HTML donde se realiza la búsqueda. Por ejemplo, si quisiera ejecutar la búsqueda solo contra el texto contenido en los encabezados h3, podría proporcionar //h3.
  • Área de contenido – Puede especificar el área de contenido utilizada para el recuento de palabras, el análisis de contenido casi duplicado y las revisiones ortográficas y gramaticales, que también se pueden seleccionar para la búsqueda personalizada. De forma predeterminada, esto incluye el texto contenido en el elemento HTML del cuerpo, excluyendo los elementos de navegación y pie de página para centrarse en el contenido principal de la página. Los elementos HTML, las clases y los ID se pueden excluir e incluir, según el área de contenido guía.

Elegir dónde buscar suele ser muy poderoso. Un buen ejemplo de esto es encontrar dónde escribimos mal ‘Screaming Frog’ como ‘Screaming frog’, sin una ‘F’ mayúscula en nuestro propio sitio web.

Ejecutar una búsqueda que distingue entre mayúsculas y minúsculas con ‘Texto de página’ trae 7 ocurrencias en nuestro enlaces rotos entrada en el blog.

Búsqueda personalizada de Screaming Frog

Sin embargo, al revisar la página, los errores ortográficos se encuentran en la sección de «comentarios» de la publicación del blog, en lugar de en el cuerpo principal del blog.

Para excluir esta sección de comentarios de la búsqueda personalizada, puede hacer clic con el botón derecho en un navegador y ‘ver fuente’ del HTML y buscar la sección de ‘comentarios’ adecuada en el HTML.

Esto muestra una identificación HTML de ‘comentarios’, que se puede usar para la exclusión.

Excluir ID de HTML en la configuración de contenido para la búsqueda personalizada

El ID de ‘comentarios’ se puede excluir en ‘Área de contenido’ en ‘Configuración > Contenido > Área’.

Área de contenido utilizada para la revisión ortográfica y gramatical

La sección de comentarios no se analizará para la búsqueda personalizada, y podemos ver que al volver a ejecutar la búsqueda, esto muestra que hay 0 ocurrencias en esta página.

Búsqueda personalizada usando el área de contenido

Multilínea

Puede expandir su búsqueda personalizada para que tenga varias líneas en el HTML. Esto significa que se puede utilizar para buscar código completo en HTML, como los códigos de seguimiento de Google Analytics (hay otras plataformas de análisis disponibles).

Haga clic en las flechas a la derecha del cuadro de consulta de búsqueda para expandir el área de texto y puede ingresar un fragmento de contenedor GTM completo, por ejemplo.

Búsqueda personalizada de varias líneas

Esto significa que no necesita comprometer las búsquedas a líneas singulares más pequeñas o palabras de una etiqueta de seguimiento, puede verificar el fragmento completo.

Analizar con datos de rastreo

Los datos del filtro de búsqueda personalizado se agregan automáticamente a la pestaña «Interno», que combina todos los datos internos en un rastreo.

Búsqueda personalizada con datos de rastreo

Por lo tanto, puede hacer coincidir las búsquedas personalizadas con otros datos de rastreo para obtener más información.

Extracción de datos

Finalmente, vale la pena reiterar que la búsqueda personalizada no ‘raspa’ ni extrae datos, solo busca.

Para extraer contenido, necesitará usar extracción personalizada en cambio.


Resumen

La guía anterior debe ilustrar cómo usar el Screaming Frog para encontrar palabras, frases, etiquetas de seguimiento o fragmentos de texto en las páginas de su sitio web.

¿Quieres saber más? Accede a la guía de Screaming Frog

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *