Construisons un Agent d'Automatisation de Navigateur en utilisant gpt-oss (100% local) :
Le navigateur est toujours l'interface la plus universelle avec 4,3 milliards de pages visitées chaque jour ! Voici une démonstration rapide de la façon dont nous pouvons complètement l'automatiser ! Technologies utilisées : - @stagehanddev automatisation de navigateur AI open-source - @crewAIInc pour l'orchestration - @ollama pour exécuter gpt-oss Allons-y !🚀
Aperçu du système : - L'utilisateur saisit une requête d'automatisation. - L'Agent Planificateur crée un plan d'automatisation. - L'Agent d'Automatisation du Navigateur l'exécute en utilisant l'outil Stagehand. - L'Agent de Réponse génère une réponse. Maintenant, plongeons dans le code !
1️⃣ Définir LLM Nous utilisons trois LLM : - LLM de planification : Crée un plan structuré pour une tâche d'automatisation. - LLM d'automatisation : Exécute le plan en utilisant l'outil Stagehand. - LLM de réponse : Synthétise la réponse finale. Regardez ça 👇
2️⃣ Définir l'Agent de Planification d'Automatisation L'agent de planification reçoit une tâche d'automatisation de l'utilisateur et crée une mise en page structurée pour l'exécution par l'agent du navigateur. Regardez ça 👇
3️⃣ Définir l'outil de navigateur Stagehand Un outil personnalisé CrewAI utilise l'IA pour interagir avec les pages web. Il exploite les capacités agentiques d'utilisation informatique de Stagehand pour naviguer de manière autonome sur les URL, effectuer des actions sur les pages et extraire des données pour répondre aux questions. Regardez ça 👇
4️⃣ Définir l'Agent d'Automatisation de Navigateur L'Agent d'Automatisation de Navigateur utilise l'outil Stagehand mentionné ci-dessus pour le contrôle autonome du navigateur et l'exécution de plans. Regardez ça 👇
5️⃣ Définir l'Agent de Synthèse de Réponse L'Agent de Synthèse agit comme un contrôle qualité final, affinant la sortie de l'agent d'automatisation du navigateur pour générer une réponse soignée. Regardez ça 👇
6️⃣ Créer le flux Agentic de CrewAI Enfin, nous connectons nos Agents au sein d'un flux de travail en utilisant les Flows de CrewAI. Vérifiez ceci 👇
C'est fait ! Voyons notre flux de travail d'automatisation de navigateur multi-agents en action ! 🚀 Vérifiez ceci 👇
Vous pouvez trouver tout le code et tout ce dont vous avez besoin dans le dépôt GitHub partagé ci-dessous. Regardez ça 👇
Pour résumer, voici un aperçu du système pour votre référence : - L'utilisateur saisit une requête d'automatisation. - L'Agent Planificateur crée un plan d'automatisation. - L'Agent d'Automatisation du Navigateur l'exécute en utilisant l'outil Stagehand. - L'Agent de Réponse génère une réponse. Vérifiez ceci👇
Si vous l’avez trouvé perspicace, partagez-le à nouveau avec votre réseau. Trouvez-moi → @akshay_pachaar ✔️ Pour plus d’informations et de tutoriels sur les LLM, les agents d’IA et l’apprentissage automatique !
Akshay 🚀
Akshay 🚀10 août, 20:51
Construisons un Agent d'Automatisation de Navigateur en utilisant gpt-oss (100% local) :
87,04K