Vamos criar um Agente de Automação do Navegador usando gpt-oss (100% local):
O navegador ainda é a interface mais universal, com 4,3 bilhões de páginas visitadas todos os dias! Aqui está uma demonstração rápida de como podemos automatizá-lo completamente! Pilha de tecnologia: - @stagehanddev automação de navegador de IA de código aberto - @crewAIInc para orquestração - @ollama executar o gpt-oss Vamos!🚀
Visão geral do sistema: - O usuário insere uma consulta de automação. - O Agente do Planner cria um plano de automação. - O Agente de Automação do Navegador o executa usando a ferramenta Stagehand. - O Agente de resposta gera uma resposta. Agora, vamos mergulhar no código!
1️⃣ Definir LLM Usamos três LLMs: - Planner LLM: Cria um plano estruturado para uma tarefa de automação. - LLM de automação: executa o plano usando a ferramenta Stagehand. - Resposta LLM: Sintetiza a resposta final. Confira isso 👇
2️⃣ Definir Agente do Automation Planner O agente do planejador recebe uma tarefa de automação do usuário e cria um layout estruturado para execução pelo agente do navegador. Confira isso 👇
3️⃣ Definir ferramenta de navegador de palco Uma ferramenta personalizada do CrewAI utiliza IA para interagir com páginas da web. Ele aproveita os recursos agenciais de uso do computador do Stagehand para navegar de forma autônoma em URLs, executar ações de página e extrair dados para responder a perguntas. Confira isso 👇
4️⃣ Definir Agente de Automação do Navegador O Browser Automation Agent utiliza a ferramenta Stagehand mencionada acima para controle autônomo do navegador e execução do plano. Confira isso 👇
5️⃣ Definir Agente de Síntese de Resposta O Synthesis Agent atua como controle de qualidade final, refinando a saída do agente de automação do navegador para gerar uma resposta polida. Confira isso 👇
6️⃣ Criar fluxo agêntico CrewAI Por fim, conectamos nossos agentes em um fluxo de trabalho usando o CrewAI Flows. Verifique isso 👇
Terminado! Vamos ver nosso fluxo de trabalho de automação de navegador multiagente em ação! 🚀 Verifique isso 👇
Você pode encontrar todo o código e tudo o que precisa no repositório GitHub compartilhado abaixo. Confira isso 👇
Para recapitular, aqui está a visão geral do sistema para sua referência: - O usuário insere uma consulta de automação. - O Agente do Planner cria um plano de automação. - O Agente de Automação do Navegador o executa usando a ferramenta Stagehand. - O Agente de resposta gera uma resposta. Verifique isso👇
Se você achou perspicaz, compartilhe novamente com sua rede. Encontre-me → @akshay_pachaar ✔️ Para obter mais insights e tutoriais sobre LLMs, agentes de IA e aprendizado de máquina!
Akshay 🚀
Akshay 🚀10 de ago., 20:51
Vamos criar um Agente de Automação do Navegador usando gpt-oss (100% local):
87,05K