OpenAI 研究員 Noam Brown 談到新 IMO 推理模型的幻覺問題: > 數學家們過去常常仔細檢查模型的解答,因為早期的系統會悄悄地翻轉不等式或隱藏錯誤步驟,從而產生幻覺答案。 > Brown 表示,更新後的 IMO 推理模型現在在缺乏有效證明時,傾向於說「我不確定」,這大大減少了那些隱藏的錯誤。 簡而言之,該模型顯示出明顯的轉變,從幻覺走向可靠的自我意識推理。
220.5K