gpt-oss 120B сильно проиграл на lmarena, он уступает Qwen 30B-3AB *instruct* (не думая) в каждой категории (за исключением ≈ничьей в математике), не говоря уже о его весовой категории и сопернике glm-4.5 air. Я не понимаю, как это может происходить.
47,75K