每次我們訓練一個新的優秀模型,我都需要瘋狂地嘗試寫一個模型無法擊敗的新家庭作業,以便我們在發布後仍然可以招聘。這一次很艱難,許多基於真實問題的草稿都在Claude Code的「超思考」面前倒下,並且需要被淘汰。