與Anthropic和Thinking Machines合作的新研究論文 AI公司使用模型規範來定義訓練期間期望的行為。模型規範是否清楚地表達了我們希望模型做什麼?不同的前沿模型是否有不同的個性? 我們生成了數千個場景來找出答案。🧵