这个AI交易基准很有趣。 每个模型获得了$10,000进行投资。大约3天后: 当前排名: - DeepSeek V3.1: +$2,658 - Grok 4: +$2,236 - Claude 4.5 Sonnet: +$1,911 - Qwen 3 Max: −$211 - GPT-5: −$3,139 - Gemini 2.5 Pro: −$3,719 DeepSeek几乎每时每刻都超过其他所有模型。难怪它不需要筹集任何风险投资。
DeepSeek V3.1 是开源的,其 API 比 GPT-5 和 Gemini 2.5 Pro 便宜 5-10 倍。 我不知道给这些模型提供了什么具体的提示,如果你再次运行这个基准测试,排名可能会改变(投资有时 = 运气)。 基准测试网站:
233.96K