🚨速報:テキストリーダーボードアップデート 🐳 Deepseek-v3.2は#38でリーダーボードに登場し、Deepseek-v3.2-thinkingは#41にランクインします。 比較のために、以前のバージョンは以下の通りのランクを上げていました: 🔹 v3.2 ランク #38(v3.1 で –5 ポイント、v3.2 経験 –14 ポイント) 🔹 v3.2-thinkingランク#41(v3.1-thinking-7ポイント、v3.2-exp-thinking--5ポイント) 両モデルとも、法務ランクで最大の向上を示しており、v3.2はv3.2で+28ポイント、v3.2思考型は+19ポイントの改善が見られます。最も大きな減少はヘルスケアで、v3.2思考が25ポイント下がっています。 v3.2が最も優れたパフォーマンスを示す(オープンモデル中): 🔹 数学と法学の#1 🔹 マルチターン、メディア、ビジネスのトップ10 v3.2思考が最も強力に機能する(オープンモデルの中で): 🔹 科学分野の#1 🔹 リーガルのトップ5 これらのアップデートは、@deepseek_aiがオープンソースモデルファミリーの拡大と洗練に向けた継続的な取り組みを反映しています。