今年夏初,OpenAI 和 Anthropic 同意在彼此的模型上嘗試一些我們現有的最佳不一致性測試。 在私下討論我們的結果後,我們現在將其與世界分享。🧵
79.43K