🚨突发消息:文本排行榜更新 🐳 Deepseek-v3.2 进入排行榜,排名第38,Deepseek-v3.2-thinking 排名第41。 作为对比,之前的版本排名更高: 🔹 v3.2 排名第38(比 v3.1 下降 5 分,比 v3.2-exp 下降 14 分) 🔹 v3.2-thinking 排名第41(比 v3.1-thinking 下降 7 分,比 v3.2-exp-thinking 下降 5 分) 两个模型在法律领域的排名上都有最大的提升,v3.2 比 v3.1 前身提高了 28 分,v3.2-thinking 提高了 19 分。最大的下降出现在医疗领域,v3.2-thinking 下降了 25 分。 v3.2 在开放模型中表现最强的领域: 🔹 数学和法律排名第1 🔹 多轮对话、媒体和商业排名前10 v3.2-thinking 在开放模型中表现最强的领域: 🔹 科学排名第1 🔹 法律排名前5 这些更新反映了 @deepseek_ai 持续努力扩展和完善其开源模型系列的工作。