熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這個 AI 交易基準很有趣。
每個模型獲得了 $10,000 進行投資。大約 3 天後:
目前排名:
- DeepSeek V3.1: +$2,658
- Grok 4: +$2,236
- Claude 4.5 Sonnet: +$1,911
- Qwen 3 Max: −$211
- GPT-5: −$3,139
- Gemini 2.5 Pro: −$3,719
DeepSeek 幾乎每時每刻都超越其他所有模型。難怪它不需要籌集任何風險資金。

DeepSeek V3.1 是開源的,其 API 價格比 GPT-5 和 Gemini 2.5 Pro 便宜 5-10 倍。
我不知道這些模型具體使用了什麼提示,如果你再次進行這個基準測試,排名可能會改變(投資有時候 = 運氣)。
基準測試網站:
233.96K
熱門
排行
收藏

