對於新的 @OpenAI gpt-oss 在 @layerlens_ai 中進行一些數學推理比較。在 AIME 2025 基準中,@deepseek_ai 的 R1 表現略好於 gpt-oss。然而,與 @Alibaba_Qwen 相比,gpt-oss 的表現確實更為出色。
314