gpt-oss 120B föll av hårt på lmarena, den förlorar mot Qwen 30B-3AB *instruera* (inte tänker) på varje kategori (utom ≈oavgjort i matte), för att inte tala om sin viktklass och kategori kamrat glm-4.5 luft. Jag förstår inte hur detta kan hända.
47,76K