Construyamos un Agente de Automatización de Navegador usando gpt-oss (100% local):
¡El navegador sigue siendo la interfaz más universal con 4.3 mil millones de páginas visitadas cada día! ¡Aquí hay una demostración rápida de cómo podemos automatizarlo completamente! Tecnología utilizada: - @stagehanddev automatización de navegador AI de código abierto - @crewAIInc para orquestación - @ollama para ejecutar gpt-oss ¡Vamos!🚀
Descripción general del sistema: - El usuario ingresa una consulta de automatización. - El Agente Planificador crea un plan de automatización. - El Agente de Automatización del Navegador lo ejecuta utilizando la herramienta Stagehand. - El Agente de Respuesta genera una respuesta. ¡Ahora, profundicemos en el código!
1️⃣ Definir LLM Usamos tres LLMs: - LLM de Planificación: Crea un plan estructurado para una tarea de automatización. - LLM de Automatización: Ejecuta el plan utilizando la herramienta Stagehand. - LLM de Respuesta: Sintetiza la respuesta final. Mira esto 👇
2️⃣ Definir Agente Planificador de Automatización El agente planificador recibe una tarea de automatización del usuario y crea un diseño estructurado para la ejecución por parte del agente del navegador. Mira esto 👇
3️⃣ Definir la herramienta de navegador Stagehand Una herramienta personalizada de CrewAI utiliza IA para interactuar con páginas web. Aprovecha las capacidades agentivas de uso informático de Stagehand para navegar de forma autónoma por URLs, realizar acciones en la página y extraer datos para responder preguntas. Mira esto 👇
4️⃣ Definir Agente de Automatización del Navegador El Agente de Automatización del Navegador utiliza la herramienta Stagehand mencionada anteriormente para el control autónomo del navegador y la ejecución de planes. Mira esto 👇
5️⃣ Definir Agente de Síntesis de Respuesta El Agente de Síntesis actúa como el control de calidad final, refinando la salida del agente de automatización del navegador para generar una respuesta pulida. Mira esto 👇
6️⃣ Crea el Flujo Agentic de CrewAI Finalmente, conectamos nuestros Agentes dentro de un flujo utilizando los Flujos de CrewAI. Revisa esto 👇
¡Hecho! ¡Veamos nuestro flujo de trabajo de automatización de navegador multi-agente en acción! 🚀 Mira esto 👇
Puedes encontrar todo el código y todo lo que necesitas en el repositorio de GitHub compartido a continuación. Mira esto 👇
Para resumir, aquí está la visión general del sistema para tu referencia: - El usuario ingresa una consulta de automatización. - El Agente Planificador crea un plan de automatización. - El Agente de Automatización del Navegador lo ejecuta utilizando la herramienta Stagehand. - El Agente de Respuesta genera una respuesta. Revisa esto👇
Si te ha resultado interesante, vuelve a compartirlo con tu red. Encuéntrame → @akshay_pachaar ✔️ Para obtener más información y tutoriales sobre LLM, agentes de IA y aprendizaje automático.
Akshay 🚀
Akshay 🚀10 ago, 20:51
Construyamos un Agente de Automatización de Navegador usando gpt-oss (100% local):
87.02K