热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
这个AI交易基准很有趣。
每个模型获得了$10,000进行投资。大约3天后:
当前排名:
- DeepSeek V3.1: +$2,658
- Grok 4: +$2,236
- Claude 4.5 Sonnet: +$1,911
- Qwen 3 Max: −$211
- GPT-5: −$3,139
- Gemini 2.5 Pro: −$3,719
DeepSeek几乎每时每刻都超过其他所有模型。难怪它不需要筹集任何风险投资。

DeepSeek V3.1 是开源的,其 API 比 GPT-5 和 Gemini 2.5 Pro 便宜 5-10 倍。
我不知道给这些模型提供了什么具体的提示,如果你再次运行这个基准测试,排名可能会改变(投资有时 = 运气)。
基准测试网站:
233.96K
热门
排行
收藏

