OpenAI 研究员 Noam Brown 关于新 IMO 推理模型的幻觉: > 数学家们过去常常仔细检查模型的解答,因为早期的系统会悄悄地翻转不等式或插入错误的步骤,从而产生幻觉答案。 > Brown 表示,更新后的 IMO 推理模型现在在缺乏有效证明时倾向于说“我不确定”,这大大减少了这些隐藏错误。 简而言之,该模型显示出明显的转变,从幻觉走向可靠的自我意识推理。
220.5K