Să construim un agent de automatizare a browserului folosind gpt-oss (100% local):
Browserul este încă cea mai universală interfață cu 4,3 miliarde de pagini vizitate în fiecare zi! Iată o demonstrație rapidă despre cum o putem automatiza complet! Stiva tehnologică: - @stagehanddev automatizarea browserului AI open-source - @crewAIInc pentru orchestrare - @ollama să ruleze gpt-oss Să mergem!🚀
Prezentare generală a sistemului: - Utilizatorul introduce o interogare de automatizare. - Agentul Planner creează un plan de automatizare. - Agentul de automatizare a browserului îl execută folosind instrumentul Stagehand. - Agentul de răspuns generează un răspuns. Acum, să ne scufundăm în cod!
1️⃣ Definește LLM Folosim trei LLM-uri: - Planner LLM: Creează un plan structurat pentru o sarcină de automatizare. - Automatizare LLM: Execută planul folosind instrumentul Stagehand. - Răspuns LLM: Sintetizează răspunsul final. Verifică 👇 asta
2️⃣ Definiți agentul Automation Planner Agentul de planificare primește o sarcină de automatizare de la utilizator și creează un aspect structurat pentru execuție de către agentul browser. Verifică 👇 asta
3️⃣ Definiți instrumentul de browser Stagehand Un instrument personalizat CrewAI utilizează AI pentru a interacționa cu paginile web. Folosește capacitățile agentice de utilizare a computerului Stagehand pentru a naviga în mod autonom adresele URL, a efectua acțiuni de pagină și a extrage date pentru a răspunde la întrebări. Verifică 👇 asta
4️⃣ Definiți agentul de automatizare a browserului Browser Automation Agent utilizează instrumentul Stagehand menționat mai sus pentru controlul autonom al browserului și executarea planurilor. Verifică 👇 asta
5️⃣ Definiți agentul de sinteză a răspunsului Agentul de sinteză acționează ca control final al calității, rafinând rezultatul agentului de automatizare a browserului pentru a genera un răspuns rafinat. Verifică 👇 asta
6️⃣ Creați fluxul agentic CrewAI În cele din urmă, ne conectăm agenții într-un flux de lucru folosind CrewAI Flows. Verificați acest lucru 👇
Făcut! Să vedem fluxul nostru de lucru de automatizare a browserului cu mai mulți agenți în acțiune! 🚀 Verificați acest lucru 👇
Puteți găsi tot codul și tot ce aveți nevoie în GitHub Repository partajat mai jos. Verifică 👇 asta
Pentru a recapitula, iată prezentarea generală a sistemului pentru referință: - Utilizatorul introduce o interogare de automatizare. - Agentul Planner creează un plan de automatizare. - Agentul de automatizare a browserului îl execută folosind instrumentul Stagehand. - Agentul de răspuns generează un răspuns. Verificați acest lucru👇
Dacă ți s-a părut util, redistribui cu rețeaua ta. Găsește-mă → @akshay_pachaar ✔️ Pentru mai multe informații și tutoriale despre LLM-uri, agenți AI și învățare automată!
Akshay 🚀
Akshay 🚀10 aug., 20:51
Să construim un agent de automatizare a browserului folosind gpt-oss (100% local):
87,09K