Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
J'ai travaillé sur un banc d'essai de système de mémoire LLM, où des simulateurs d'utilisateurs basés sur Kimi K2 ont des conversations avec des modèles transitoires ayant accès à un outil de mémoire. J'étais curieux de connaître l'effet du paramètre de limite mentionné ci-dessous, alors j'ai laissé 35 chercheurs spirituels humains simulés par Kimi s'affronter dans trois configurations :
- chatgpt-4o-latest, avec un prompt système très similaire à celui utilisé dans chatgpt
- claude sonnet 4.5, avec un prompt système très similaire à celui utilisé dans claude dot ai, y compris le paramètre de limite
- claude sonnet 4.5, utilisant le même prompt système mais avec le paramètre de limite supprimé
Dans l'image ci-dessous, j'ai agrégé les résultats de chaque scénario et les ai mélangés - ils ne sont pas dans le même ordre que celui listé ci-dessus. Je suis curieux de savoir si les gens peuvent deviner quelles sont les configurations A, B et C.

Meilleurs
Classement
Favoris

