🚨 Cela pourrait être le plus grand bond en avant pour les agents IA depuis ReAct. Des chercheurs viennent de dévoiler DeepAgent, un modèle de raisonnement capable de penser, de découvrir des outils et d'agir complètement de manière autonome. Pas de flux de travail pré-écrits. Pas de listes d'outils fixes. Juste un raisonnement autonome pur. Il introduit quelque chose de fou appelé Memory Folding, l'agent « compresse » littéralement ses pensées passées en souvenirs épisodiques, de travail et d'outils structurés… comme un cerveau numérique prenant une respiration avant de penser à nouveau. Ils ont également développé une nouvelle méthode RL appelée ToolPO, qui récompense l'agent non seulement pour avoir terminé des tâches, mais aussi pour la manière dont il a utilisé les outils en cours de route. Les résultats ? DeepAgent surpasse les agents de niveau GPT-4 sur presque tous les benchmarks WebShop, ALFWorld, GAIA, même avec des outils ouverts qu'il n'a jamais vus. C'est le premier véritable pas vers des agents de raisonnement général capables d'opérer comme des humains, se souvenant, s'adaptant et apprenant à penser. L'ère des agents vient de passer à la vitesse supérieure.