إجراء بعض مقارنات التفكير الرياضي ل @OpenAI gpt-oss الجديد في @layerlens_ai. في معيار AIME 2025 ، @deepseek_ai أداء R1 أفضل قليلا من gpt-oss. ومع ذلك ، عند مقارنتها ب @Alibaba_Qwen ، يتفوق gpt-oss حقا
‏‎365‏