今年夏初,OpenAI 和 Anthropic 同意在彼此的模型上尝试一些我们现有的最佳不一致性测试。 在私下讨论我们的结果后,我们现在将其与世界分享。🧵
73.75K