Browser-Use integrado con Github Actions

2 May, 2025 | IA

En este proyecto presento una implementación personalizada de la biblioteca browser-use, diseñada para facilitar la interacción de agentes de inteligencia artificial con sitios web a través de navegadores reales. La solución permite automatizar tareas de navegación web con agentes inteligentes, ofreciendo además funcionalidades avanzadas para generar reportes en HTML, grabar videos de las sesiones y una integración completa con pipelines de CI/CD mediante GitHub Actions.

¿Qué hace este agente de IA?

  • Automatización de navegación web: El agente simula interacciones reales en el navegador Chromium, navegando, haciendo clic y extrayendo información de sitios web de forma programada y controlada.
  • Generación de reportes HTML: Al finalizar las sesiones, el agente crea reportes visuales que resumen las acciones realizadas, resultados obtenidos y métricas relevantes, facilitando el análisis y seguimiento.
  • Grabación de video: Cada ejecución puede registrar un video de la sesión de navegación, ideal para auditorías, revisiones o demostraciones.
  • Integración con CI/CD: Gracias a la configuración con GitHub Actions, es posible automatizar la ejecución del agente en entornos controlados, asegurando pruebas continuas y monitoreo constante.

¿Cómo funciona?

El proyecto está desarrollado en Python y utiliza Playwright para controlar el navegador Chromium. La configuración es sencilla, basada en un archivo .env donde se definen claves de API y parámetros necesarios para la ejecución.

Para iniciar el agente, solo necesitas clonar el repositorio, instalar las dependencias y ejecutar el script principal run.py. Los reportes y videos generados se almacenan en la carpeta report/ para fácil acceso y revisión.

¿Por qué es útil?

Este agente es ideal para equipos que necesitan automatizar pruebas funcionales, monitoreo de sitios web o recolección de datos de forma inteligente y reproducible. La capacidad de generar reportes detallados y videos añade valor para la documentación y análisis, mientras que la integración con CI/CD permite incorporar estas tareas en flujos de trabajo automatizados y confiables.

Si te interesa la automatización avanzada con agentes de IA y la integración continua, te invito a explorar el repositorio completo: browser-use. Allí encontrarás toda la documentación, ejemplos y código para comenzar a implementar tus propios agentes inteligentes de navegación web.

¿Quieres saber más sobre automatización, IA y pipelines CI/CD? ¡Déjame un comentario y seguimos compartiendo conocimiento!