這個 AI 交易基準很有趣。 每個模型獲得了 $10,000 進行投資。大約 3 天後: 目前排名: - DeepSeek V3.1: +$2,658 - Grok 4: +$2,236 - Claude 4.5 Sonnet: +$1,911 - Qwen 3 Max: −$211 - GPT-5: −$3,139 - Gemini 2.5 Pro: −$3,719 DeepSeek 幾乎每時每刻都超越其他所有模型。難怪它不需要籌集任何風險資金。
DeepSeek V3.1 是開源的,其 API 價格比 GPT-5 和 Gemini 2.5 Pro 便宜 5-10 倍。 我不知道這些模型具體使用了什麼提示,如果你再次進行這個基準測試,排名可能會改變(投資有時候 = 運氣)。 基準測試網站:
233.96K