热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
🚨突发消息:文本排行榜更新
🐳 Deepseek-v3.2 进入排行榜,排名第38,Deepseek-v3.2-thinking 排名第41。
作为对比,之前的版本排名更高:
🔹 v3.2 排名第38(比 v3.1 下降 5 分,比 v3.2-exp 下降 14 分)
🔹 v3.2-thinking 排名第41(比 v3.1-thinking 下降 7 分,比 v3.2-exp-thinking 下降 5 分)
两个模型在法律领域的排名上都有最大的提升,v3.2 比 v3.1 前身提高了 28 分,v3.2-thinking 提高了 19 分。最大的下降出现在医疗领域,v3.2-thinking 下降了 25 分。
v3.2 在开放模型中表现最强的领域:
🔹 数学和法律排名第1
🔹 多轮对话、媒体和商业排名前10
v3.2-thinking 在开放模型中表现最强的领域:
🔹 科学排名第1
🔹 法律排名前5
这些更新反映了 @deepseek_ai 持续努力扩展和完善其开源模型系列的工作。

热门
排行
收藏

