gpt-oss 120B cayó drásticamente en lmarena, pierde ante Qwen 30B-3AB *instruct* (sin pensar) en cada categoría (excepto un ≈empate en matemáticas), por no hablar de su clase de peso y del compañero de categoría glm-4.5 air. No entiendo cómo puede suceder esto.
47,75K