J'ai fait passer mon jeu multi-agents de 83 % d'exécutions réussies à un peu plus de 92 %. Une énorme amélioration ! Voici la leçon la plus importante que j'ai apprise : Déplacez autant de fonctionnalités que possible dans des outils et laissez le LLM les utiliser. Moins le LLM a de travail à faire, mieux c'est. Un LLM est bien meilleur pour décider quel outil utiliser que pour faire le travail de cet outil par lui-même, même lorsque c'est un travail simple. J'ai réduit un prompt de 100 lignes à 25 lignes et 3 fonctions Python qui implémentent toutes les fonctionnalités. L'inconvénient est plus de code, mais l'avantage est que la fiabilité a augmenté de presque 10 %.