对新推出的 @OpenAI gpt-oss 在 @layerlens_ai 上进行一些数学推理比较。在 AIME 2025 基准测试中,@deepseek_ai 的 R1 表现略优于 gpt-oss。然而,与 @Alibaba_Qwen 相比,gpt-oss 的表现确实更为出色。
315