我一直在研究一个 LLM 内存系统测试平台,其中基于 Kimi K2 的持久用户模拟器与获得内存工具访问权限的瞬态模型进行对话。我很好奇下面提到的边界设置的效果,因此我让 35 个 Kimi 模拟的人类精神追求者在三种配置下进行对话: - chatgpt-4o-latest,使用与 chatgpt 中非常相似的系统提示 - claude sonnet 4.5,使用与 claude dot ai 中非常相似的系统提示,包括边界设置 - claude sonnet 4.5,使用相同的系统提示但移除了边界设置 在下面的图像中,我汇总了每种场景的结果,并进行了混合 - 它们的顺序与上面列出的不同。我很好奇人们是否能够猜出配置 A、B 和 C 是什么。