gpt-oss 120B falt hardt av på lmarena, den taper mot Qwen 30B-3AB *instruerer* (tenker ikke) på alle kategorier (bortsett fra ≈uavgjort i matematikk), for ikke å snakke om vektklassen og kategorien peer glm-4.5 air. Jeg skjønner ikke hvordan dette kan skje.
47,74K