Workflow de Scraping con Selenium, OpenAI y Google Search
Este workflow automatiza el proceso de scraping web utilizando Selenium para navegar y extraer información de sitios web. El flujo comienza con un trigger (Webhook) que proporciona una URL objetivo y un tema de búsqueda. Selenium inicia una sesión de navegador, navega a la URL, y extrae el contenido HTML. Si la página requiere cookies, el workflow las gestiona. Un nodo ‘If’ verifica si la extracción fue exitosa; de lo contrario, se gestiona el error. La información extraída se limpia y se procesa, utilizando modelos de lenguaje OpenAI para análisis semántico y extracción de información clave. Si la información es insuficiente, se realiza una búsqueda en Google utilizando el tema y el dominio del sitio web para obtener información adicional. Finalmente, el workflow devuelve la información extraída, incluyendo capturas de pantalla del proceso. Se utilizan múltiples nodos ‘httpRequest’ para interactuar con el Selenium webdriver, gestionar sesiones, obtener capturas de pantalla y navegar. Los modelos OpenAI se emplean para el análisis de texto e imágenes. El workflow incluye manejo de errores y múltiples comprobaciones para asegurar la robustez del proceso. Automatización completa del proceso de scraping web. Integración con Selenium para la navegación web. Uso de modelos de lenguaje OpenAI para