Jag fick mitt multi-agent-spel från 83% lyckade avrättningar till lite över 92%. Stor förbättring! Här är den viktigaste läxan jag lärde mig: Flytta så mycket funktionalitet som möjligt till verktyg och låt LLM använda dem. Ju mindre LLM har att göra, desto bättre. En LLM är mycket bättre på att bestämma vilket verktyg som ska användas än att göra arbetet med det verktyget själv, även när det är enkelt arbete. Jag minskade en prompt på 100 rader till 25 rader och 3 Python-funktioner som implementerar all funktionalitet. Nackdelen är mer kod, men uppsidan är att tillförlitligheten har ökat med nästan 10 %.