Eu consegui meu jogo multiagente de 83% de execuções bem-sucedidas para pouco mais de 92%. Grande melhoria! Aqui está a lição mais importante que aprendi: Mova o máximo de funcionalidade possível para as ferramentas e deixe o LLM usá-las. Quanto menos o LLM tiver que fazer, melhor. Um LLM é muito melhor para decidir qual ferramenta usar do que fazer o trabalho dessa ferramenta por si só, mesmo quando é um trabalho simples. Reduzi um prompt de 100 linhas para 25 linhas e 3 funções Python que implementam todas as funcionalidades. A desvantagem é mais código, mas a vantagem é que a confiabilidade aumentou quase 10%.