Browser-Use integrado con Github Actions
En este proyecto presento una implementación personalizada de la biblioteca browser-use, diseñada para facilitar la interacción de agentes de inteligencia artificial con sitios web a través de navegadores reales. La solución permite automatizar tareas de navegación web con agentes inteligentes, ofreciendo además funcionalidades avanzadas para generar reportes en HTML, grabar videos de las sesiones y una integración completa con pipelines de CI/CD mediante GitHub Actions.
¿Qué hace este agente de IA?
- Automatización de navegación web: El agente simula interacciones reales en el navegador Chromium, navegando, haciendo clic y extrayendo información de sitios web de forma programada y controlada.
- Generación de reportes HTML: Al finalizar las sesiones, el agente crea reportes visuales que resumen las acciones realizadas, resultados obtenidos y métricas relevantes, facilitando el análisis y seguimiento.
- Grabación de video: Cada ejecución puede registrar un video de la sesión de navegación, ideal para auditorías, revisiones o demostraciones.
- Integración con CI/CD: Gracias a la configuración con GitHub Actions, es posible automatizar la ejecución del agente en entornos controlados, asegurando pruebas continuas y monitoreo constante.
¿Cómo funciona?
El proyecto está desarrollado en Python y utiliza Playwright para controlar el navegador Chromium. La configuración es sencilla, basada en un archivo .env
donde se definen claves de API y parámetros necesarios para la ejecución.
Para iniciar el agente, solo necesitas clonar el repositorio, instalar las dependencias y ejecutar el script principal run.py
. Los reportes y videos generados se almacenan en la carpeta report/
para fácil acceso y revisión.
¿Por qué es útil?
Este agente es ideal para equipos que necesitan automatizar pruebas funcionales, monitoreo de sitios web o recolección de datos de forma inteligente y reproducible. La capacidad de generar reportes detallados y videos añade valor para la documentación y análisis, mientras que la integración con CI/CD permite incorporar estas tareas en flujos de trabajo automatizados y confiables.
Si te interesa la automatización avanzada con agentes de IA y la integración continua, te invito a explorar el repositorio completo: browser-use. Allí encontrarás toda la documentación, ejemplos y código para comenzar a implementar tus propios agentes inteligentes de navegación web.
¿Quieres saber más sobre automatización, IA y pipelines CI/CD? ¡Déjame un comentario y seguimos compartiendo conocimiento!