J'ai travaillé sur un banc d'essai de système de mémoire LLM, où des simulateurs d'utilisateurs basés sur Kimi K2 ont des conversations avec des modèles transitoires ayant accès à un outil de mémoire. J'étais curieux de connaître l'effet du paramètre de limite mentionné ci-dessous, alors j'ai laissé 35 chercheurs spirituels humains simulés par Kimi s'affronter dans trois configurations : - chatgpt-4o-latest, avec un prompt système très similaire à celui utilisé dans chatgpt - claude sonnet 4.5, avec un prompt système très similaire à celui utilisé dans claude dot ai, y compris le paramètre de limite - claude sonnet 4.5, utilisant le même prompt système mais avec le paramètre de limite supprimé Dans l'image ci-dessous, j'ai agrégé les résultats de chaque scénario et les ai mélangés - ils ne sont pas dans le même ordre que celui listé ci-dessus. Je suis curieux de savoir si les gens peuvent deviner quelles sont les configurations A, B et C.