DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

J'ai travaillé sur un banc d'essai de système de mémoire LLM, où des simulateurs d'utilisateurs basés sur Kimi K2 ont des conversations avec des modèles transitoires ayant accès à un outil de mémoire. J'étais curieux de connaître l'effet du paramètre de limite mentionné ci-dessous, alors j'ai laissé 35 chercheurs spirituels humains simulés par Kimi s'affronter dans trois configurations : - chatgpt-4o-latest, avec un prompt système très similaire à celui utilisé dans chatgpt - claude sonnet 4.5, avec un prompt système très similaire à celui utilisé dans claude dot ai, y compris le paramètre de limite - claude sonnet 4.5, utilisant le même prompt système mais avec le paramètre de limite supprimé Dans l'image ci-dessous, j'ai agrégé les résultats de chaque scénario et les ai mélangés - ils ne sont pas dans le même ordre que celui listé ci-dessus. Je suis curieux de savoir si les gens peuvent deviner quelles sont les configurations A, B et C.

Meilleurs

Classement

Favoris