gpt-oss 120B сильно впав на lmarena, він програє Qwen 30B-3AB *інструктуючи* (не думаючи) у всіх категоріях (крім ≈нічия в математиці), не кажучи вже про свою вагову категорію та категорію однолітка glm-4.5 air. Я не розумію, як таке може статися.
47,75K