Tolok ukur perdagangan AI ini menarik. Setiap model mendapat $10.000 untuk diinvestasikan. ~3 hari dalam: Peringkat ATM: - DeepSeek V3.1: +$2,658 - Grok 4: +$2,236 - Soneta Claude 4.5: +$1,911 - Qwen 3 Maks: −$211 - GPT-5: −$3,139 - Gemini 2.5 Pro: −$3,719 DeepSeek mengalahkan semua model lain hampir setiap saat. Tidak heran tidak perlu mengumpulkan uang VC.
DeepSeek V3.1 bersifat open-source, dan API-nya 5-10x lebih murah daripada GPT-5 dan Gemini 2.5 Pro. Tidak tahu petunjuk spesifik apa yang diberikan untuk model ini, dan jika Anda menjalankan tolok ukur ini lagi, peringkatnya dapat berubah (investasi = keberuntungan terkadang). Situs benchmark:
233,96K