gpt-oss 120B is hard gevallen op lmarena, het verliest van Qwen 30B-3AB *instruct* (niet nadenken) in elke categorie (behalve ≈gelijk in wiskunde), om nog maar te zwijgen van zijn gewichtsklasse en categoriegenoot glm-4.5 air. Ik begrijp niet hoe dit kan gebeuren.
47,75K