gpt-oss 120B a chuté durement sur lmarena, il perd face à Qwen 30B-3AB *instruct* (sans réfléchir) dans chaque catégorie (sauf ≈égalité en mathématiques), sans parler de sa catégorie de poids et de son pair glm-4.5 air. Je ne comprends pas comment cela peut arriver.
47,75K