Introducción a la búsqueda personalizada
Screaming Frog le permite encontrar lo que desee en el HTML o el texto de un sitio web utilizando su función de búsqueda personalizada.
Esto puede ser útil al verificar etiquetas de análisis o descubrir qué páginas tienen ciertas palabras o frases, como una marca antigua, «agotado» o frases clave para oportunidades de enlaces internos.
Puede configurar hasta 100 filtros de búsqueda mediante la búsqueda personalizada, lo que le permite ingresar texto o expresiones regulares y encontrar páginas que ‘contienen’ o ‘no contienen’ su entrada elegida e informan la cantidad de ocurrencias.
Este tutorial lo guía a través de cómo usar la función, escenarios comunes y búsquedas más avanzadas.
Para comenzar, descargue el spider SEO que es gratuito para rastrear hasta 500 URL; sin embargo, esta función requiere un licencia paga para utilizar la búsqueda personalizada.
1) Agregar filtros de búsqueda personalizados
Haga clic en ‘Configuración > Personalizado > Buscar’ en el menú de nivel superior para abrir la configuración de búsqueda personalizada.
Luego haga clic en ‘Agregar’ (en la parte inferior derecha) para configurar un filtro de búsqueda personalizado.
Aparecerá un filtro de búsqueda personalizado. Puede agregar hasta 100 filtros separados en un rastreo.
2) Ingrese su búsqueda
Ahora ingrese su búsqueda en el cuadro ‘Ingresar consulta de búsqueda’ y ajuste cada opción de filtro de búsqueda.
De izquierda a derecha, puede nombrar el filtro de búsqueda, seleccionar ‘contiene’ o ‘no contiene’, elegir ‘texto’ o ‘regex’, ingresar su consulta de búsqueda y elegir dónde se realiza la búsqueda (HTML, texto de página, un elemento, o XPath y más).
El ejemplo anterior muestra una búsqueda de «Agotado» en el texto de cualquier página y una búsqueda de cualquier página que no contenga un código de seguimiento de Google Tag Manager en el elemento de encabezado HTML de una página.
Cuando los filtros están configurados, puede hacer clic en ‘Aceptar’ y ejecutar un rastreo para realizar la búsqueda.
3) Rastrear el sitio web
Escriba o copie el sitio web que desea rastrear en el cuadro ‘Enter URL to spider’ y presione ‘Iniciar’.
Espere hasta que finalice el rastreo y alcance el 100 %, o mire en tiempo real a medida que se completan los filtros de la pestaña de búsqueda personalizada.
4) Ver datos en la pestaña de búsqueda personalizada y filtros
Haga clic en la pestaña Búsqueda personalizada para ver los resultados de su búsqueda personalizada en tiempo real. De manera predeterminada, los datos de todas las búsquedas se muestran juntos en la pestaña, pero los filtros se pueden usar para refinar los datos para mostrar solo cada filtro por separado.
El filtro ‘contiene’ mostrará el número de ocurrencias de la búsqueda, mientras que una búsqueda ‘no contiene’ devolverá ‘Contiene’ o ‘No contiene’.
En esta búsqueda, hay 2 páginas con el texto «Agotado», cada una de las cuales contiene la palabra solo una vez, mientras que el código GTM no se encontró en ninguna de las 10 páginas.
Estos números también se pueden ver en el panel «Descripción general» de la derecha, que actualiza los recuentos de filtros en tiempo real.
5) Exportación
Exporte datos de búsqueda personalizados haciendo clic en el botón «exportar», que funciona junto con los filtros y su vista actual.
También puede exportar ‘inlinks’ (las páginas de origen que vinculan) a filtros de búsqueda personalizados a través de ‘Exportación masiva> Búsqueda personalizada> Filter X Inlinks’.
Opciones de filtro de búsqueda avanzada
La búsqueda personalizada puede ser realmente poderosa al combinar filtros y ajustar las configuraciones de los filtros de búsqueda. En particular, usando expresiones regulares y eligiendo dónde se realiza la búsqueda.
Sensibilidad de mayúsculas y minúsculas
Si necesita realizar una búsqueda con distinción entre mayúsculas y minúsculas, al buscar ‘texto’ puede hacer clic en las flechas a la derecha del cuadro para expandir el área de texto y elegir ‘con distinción entre mayúsculas y minúsculas’.
‘Regex’ distingue entre mayúsculas y minúsculas de forma predeterminada, para que no se distinga entre mayúsculas y minúsculas, utilice (?i) antes de la palabra. Por ejemplo –
(?i)optimización
Coincidiría con ‘optimización’ y ‘OPTIMIZACIÓN’, o incluso con ‘OpTiMiSaTiOn’.
La distinción entre mayúsculas y minúsculas puede ser particularmente útil cuando se buscan errores ortográficos en nombres de marcas, acrónimos, etc.
Palabras exactas y múltiples
Puede elegir buscar usando texto regular, o para usos más avanzados puede cambiar a expresiones regulares.
Por ejemplo, al usar expresiones regulares, puede hacer coincidir palabras exactas usando lo siguiente.
bpalabrab
Esto coincidiría con una palabra en particular (‘palabra’ en este caso), ya que b coincide con los límites de las palabras.
Esto puede ser útil al buscar palabras o frases que pueden tener otras palabras, como ‘pr’ (que aparecerán en ‘promoción’, presentación previa y más en nuestro sitio).
Sin usar límites de palabras, ‘pr’ se encuentra 12 veces en nuestra página de relaciones públicas digitales. Con una coincidencia exacta que distingue entre mayúsculas y minúsculas, en realidad es 0.
También puede combinar palabras en una búsqueda. Por ejemplo, si quisiera encontrar páginas con las palabras ‘natural’, ‘orgánico’ y ‘gratis’, podría combinar palabras en un solo filtro usando una tubería.
bnaturalb|borgánicob|blibreb
Esto contará cada instancia de cada una de las palabras, por ejemplo, nuestra página de ‘optimización de motor de búsqueda’ tiene ‘orgánico’ 3 veces y ‘natural’ y ‘gratis’ una vez, para hacer 5 en total.
Puede hacer clic en el encabezado para ordenar por ocurrencias como se muestra en el ejemplo.
Combinar búsquedas
Puede combinar filtros y verlos juntos al mismo tiempo. Entonces, si desea buscar cualquier página que contenga una palabra, pero no contenga otra palabra, use varios filtros y visualícelos juntos en la pestaña de búsqueda personalizada.
En este ejemplo, puede ver que no hay instancias en las que no se usen las palabras «rastreador» y «mejor». ¡Esto es apropiado!
Busca en
La búsqueda personalizada comprobará el HTML sin formato o el HTML renderizado en función de su modo de renderizado. De forma predeterminada, comprobará el HTML sin formato, pero si ha configurado el modo de representación de JavaScript, comprobará el HTML representado.
Luego, puede refinar exactamente dónde se realiza la búsqueda personalizada.
Estas 7 opciones disponibles le permiten controlar dónde busca:
- HTML – El HTML completo de la página web.
- Texto de página – El texto de las páginas web, excluyendo cualquier HTML.
- Texto de la página Sin anclas – El texto de las páginas web, excluyendo cualquier HTML o cualquier texto contenido dentro de las etiquetas de anclaje HTML (también conocido como Elementos A). Esto puede ser útil al buscar palabras que también se incluyen en el texto del enlace dentro de los menús, lo que puede hacer que todas las páginas se marquen para contener la búsqueda de lo contrario.
- Encabezado HTML – El encabezado HTML de la página web.
- Cuerpo HTML – El cuerpo HTML de la página web, que puede incluir HTML y texto de la página.
- XPath – Puede proporcionar un XPath para especificar la ubicación en el HTML donde se realiza la búsqueda. Por ejemplo, si quisiera ejecutar la búsqueda solo contra el texto contenido en los encabezados h3, podría proporcionar //h3.
- Área de contenido – Puede especificar el área de contenido utilizada para el recuento de palabras, el análisis de contenido casi duplicado y las revisiones ortográficas y gramaticales, que también se pueden seleccionar para la búsqueda personalizada. De forma predeterminada, esto incluye el texto contenido en el elemento HTML del cuerpo, excluyendo los elementos de navegación y pie de página para centrarse en el contenido principal de la página. Los elementos HTML, las clases y los ID se pueden excluir e incluir, según el área de contenido guía.
Elegir dónde buscar suele ser muy poderoso. Un buen ejemplo de esto es encontrar dónde escribimos mal ‘Screaming Frog’ como ‘Screaming frog’, sin una ‘F’ mayúscula en nuestro propio sitio web.
Ejecutar una búsqueda que distingue entre mayúsculas y minúsculas con ‘Texto de página’ trae 7 ocurrencias en nuestro enlaces rotos entrada en el blog.
Sin embargo, al revisar la página, los errores ortográficos se encuentran en la sección de «comentarios» de la publicación del blog, en lugar de en el cuerpo principal del blog.
Para excluir esta sección de comentarios de la búsqueda personalizada, puede hacer clic con el botón derecho en un navegador y ‘ver fuente’ del HTML y buscar la sección de ‘comentarios’ adecuada en el HTML.
Esto muestra una identificación HTML de ‘comentarios’, que se puede usar para la exclusión.
El ID de ‘comentarios’ se puede excluir en ‘Área de contenido’ en ‘Configuración > Contenido > Área’.
La sección de comentarios no se analizará para la búsqueda personalizada, y podemos ver que al volver a ejecutar la búsqueda, esto muestra que hay 0 ocurrencias en esta página.
Multilínea
Puede expandir su búsqueda personalizada para que tenga varias líneas en el HTML. Esto significa que se puede utilizar para buscar código completo en HTML, como los códigos de seguimiento de Google Analytics (hay otras plataformas de análisis disponibles).
Haga clic en las flechas a la derecha del cuadro de consulta de búsqueda para expandir el área de texto y puede ingresar un fragmento de contenedor GTM completo, por ejemplo.
Esto significa que no necesita comprometer las búsquedas a líneas singulares más pequeñas o palabras de una etiqueta de seguimiento, puede verificar el fragmento completo.
Analizar con datos de rastreo
Los datos del filtro de búsqueda personalizado se agregan automáticamente a la pestaña «Interno», que combina todos los datos internos en un rastreo.
Por lo tanto, puede hacer coincidir las búsquedas personalizadas con otros datos de rastreo para obtener más información.
Extracción de datos
Finalmente, vale la pena reiterar que la búsqueda personalizada no ‘raspa’ ni extrae datos, solo busca.
Para extraer contenido, necesitará usar extracción personalizada en cambio.
Resumen
La guía anterior debe ilustrar cómo usar el Screaming Frog para encontrar palabras, frases, etiquetas de seguimiento o fragmentos de texto en las páginas de su sitio web.
¿Quieres saber más? Accede a la guía de Screaming Frog