Costruiamo un Agente di Automazione del Browser utilizzando gpt-oss (100% locale):
Il browser è ancora l'interfaccia più universale con 4,3 miliardi di pagine visitate ogni giorno! Ecco una rapida demo di come possiamo automatizzarlo completamente! Stack tecnologico: - @stagehanddev automazione del browser AI open-source - @crewAIInc per l'orchestrazione - @ollama per eseguire gpt-oss Andiamo!🚀
Panoramica del sistema: - L'utente inserisce una query di automazione. - L'agente pianificatore crea un piano di automazione. - L'agente di automazione del browser lo esegue utilizzando lo strumento Stagehand. - L'agente di risposta genera una risposta. Ora, immergiamoci nel codice!
1️⃣ Definire LLM Utilizziamo tre LLM: - LLM Pianificatore: Crea un piano strutturato per un compito di automazione. - LLM Automazione: Esegue il piano utilizzando lo strumento Stagehand. - LLM Risposta: Sintetizza la risposta finale. Dai un'occhiata a questo 👇
2️⃣ Definire l'Agente di Pianificazione dell'Automazione L'agente di pianificazione riceve un compito di automazione dall'utente e crea un layout strutturato per l'esecuzione da parte dell'agente del browser. Dai un'occhiata a questo 👇
3️⃣ Definisci lo Strumento Browser Stagehand Uno strumento personalizzato di CrewAI utilizza l'IA per interagire con le pagine web. Sfrutta le capacità agentiche di utilizzo del computer di Stagehand per navigare autonomamente negli URL, eseguire azioni sulle pagine e estrarre dati per rispondere a domande. Dai un'occhiata a questo 👇
4️⃣ Definire l'Agente di Automazione del Browser L'Agente di Automazione del Browser utilizza lo strumento Stagehand menzionato in precedenza per il controllo autonomo del browser e l'esecuzione dei piani. Dai un'occhiata a questo 👇
5️⃣ Definisci l'Agente di Sintesi della Risposta L'Agente di Sintesi funge da controllo qualità finale, affinando l'output dell'agente di automazione del browser per generare una risposta rifinita. Dai un'occhiata a questo 👇
6️⃣ Crea il Flusso Agentico di CrewAI Infine, colleghiamo i nostri Agenti all'interno di un flusso di lavoro utilizzando i Flussi di CrewAI. Controlla questo 👇
Fatto! Vediamo il nostro flusso di lavoro di automazione del browser multi-agente in azione! 🚀 Controlla questo 👇
Puoi trovare tutto il codice e tutto ciò di cui hai bisogno nel repository GitHub condiviso qui sotto. Dai un'occhiata a questo 👇
Per riassumere, ecco una panoramica del sistema per il tuo riferimento: - L'utente inserisce una query di automazione. - L'Agente Pianificatore crea un piano di automazione. - L'Agente di Automazione del Browser lo esegue utilizzando lo strumento Stagehand. - L'Agente di Risposta genera una risposta. Controlla questo👇
Se l'hai trovato interessante, condividilo nuovamente con la tua rete. Trovami → @akshay_pachaar ✔️ Per ulteriori approfondimenti e tutorial su LLM, agenti di intelligenza artificiale e apprendimento automatico!
Akshay 🚀
Akshay 🚀10 ago, 20:51
Costruiamo un Agente di Automazione del Browser utilizzando gpt-oss (100% locale):
87,02K