新的Anthropic研究: “测试时间计算中的逆向缩放” 我们发现,在某些情况下,较长的推理导致较低的准确性。 我们的发现表明,测试时间计算的简单缩放可能无意中强化了有问题的推理模式。 🧵
143.35K