gpt-oss 120Bはlmarenaで大きく落ち、Qwen 30B-3ABに負けました(数学の同点を除く≈数学の同点を除く)、その重量クラスとカテゴリのピアであるglm-4.5 airは言うまでもありません。どうしてこんなことが起こるのかわかりません。
47.74K