Durchführung einiger mathematischer Vergleichsanalysen für das neue @OpenAI gpt-oss in @layerlens_ai. Im AIME 2025 Benchmark schneidet @deepseek_ai R1 etwas besser ab als gpt-oss. Im Vergleich zu @Alibaba_Qwen übertrifft gpt-oss jedoch wirklich.
326