Wiskundige redeneervergelijkingen uitvoeren voor de nieuwe @OpenAI gpt-oss in @layerlens_ai. In de AIME 2025 benchmark presteert @deepseek_ai R1 iets beter dan gpt-oss. Echter, vergeleken met @Alibaba_Qwen, presteert gpt-oss echt beter.
376