新的Anthropic研究: “測試時間計算中的反向縮放” 我們發現,較長的推理會導致較低的準確性。 我們的研究結果表明,天真的測試時間計算縮放可能無意中加強了有問題的推理模式。 🧵
143.35K