Realizando algunas comparaciones de razonamiento matemático para el nuevo @OpenAI gpt-oss en @layerlens_ai. En el benchmark AIME 2025, @deepseek_ai R1 se desempeña un poco mejor que gpt-oss. Sin embargo, cuando se compara con @Alibaba_Qwen, gpt-oss realmente supera.
318