gpt-oss 120B cayó con fuerza en lmarena, pierde ante Qwen 30B-3AB *instruir* (sin pensar) en todas las categorías (excepto ≈empate en matemáticas), por no hablar de su clase de peso y categoría par glm-4.5 air. No entiendo cómo puede suceder esto.
47.74K