Vamos construir um Agente de Automação de Navegador usando gpt-oss (100% local):
O navegador continua a ser a interface mais universal, com 4,3 mil milhões de páginas visitadas todos os dias! Aqui está uma demonstração rápida de como podemos automatizá-lo completamente! Stack tecnológico: - @stagehanddev automação de navegador AI de código aberto - @crewAIInc para orquestração - @ollama para executar gpt-oss Vamos lá!🚀
Visão geral do sistema: - O utilizador insere uma consulta de automação. - O Agente Planeador cria um plano de automação. - O Agente de Automação do Navegador executa-o utilizando a ferramenta Stagehand. - O Agente de Resposta gera uma resposta. Agora, vamos mergulhar no código!
1️⃣ Definir LLM Usamos três LLMs: - LLM de Planejamento: Cria um plano estruturado para uma tarefa de automação. - LLM de Automação: Executa o plano usando a ferramenta Stagehand. - LLM de Resposta: Sintetiza a resposta final. Veja isto 👇
2️⃣ Definir Agente Planeador de Automação O agente planeador recebe uma tarefa de automação do utilizador e cria um layout estruturado para execução pelo agente do navegador. Veja isto 👇
3️⃣ Definir Ferramenta de Navegação Stagehand Uma ferramenta personalizada do CrewAI utiliza IA para interagir com páginas da web. Ela aproveita as capacidades agentivas de uso de computador do Stagehand para navegar autonomamente por URLs, realizar ações na página e extrair dados para responder a perguntas. Confira isto 👇
4️⃣ Definir Agente de Automação de Navegador O Agente de Automação de Navegador utiliza a ferramenta Stagehand mencionada anteriormente para controle autónomo do navegador e execução de planos. Veja isto 👇
5️⃣ Definir Agente de Síntese de Resposta O Agente de Síntese atua como controle de qualidade final, refinando a saída do agente de automação do navegador para gerar uma resposta polida. Confira isto 👇
6️⃣ Criar o Fluxo Agentic do CrewAI Finalmente, conectamos os nossos Agentes dentro de um fluxo de trabalho usando os Fluxos do CrewAI. Verifique isto 👇
Feito! Vamos ver o nosso fluxo de trabalho de automação de navegador multi-agente em ação! 🚀 Veja isto 👇
Você pode encontrar todo o código e tudo o que precisa no repositório do GitHub compartilhado abaixo. Confira isto 👇
Para recapitular, aqui está a visão geral do sistema para sua referência: - O usuário insere uma consulta de automação. - O Agente Planejador cria um plano de automação. - O Agente de Automação do Navegador executa-o usando a ferramenta Stagehand. - O Agente de Resposta gera uma resposta. Verifique isto👇
Se você achou isso perspicaz, compartilhe novamente com sua rede. Encontre-me → @akshay_pachaar ✔️ Para mais informações e tutoriais sobre LLMs, AI Agents e Machine Learning!
Akshay 🚀
Akshay 🚀10/08, 20:51
Vamos construir um Agente de Automação de Navegador usando gpt-oss (100% local):
87,04K