Deze AI handelsbenchmark is interessant. Elk model kreeg $10.000 om te investeren. ~3 dagen in: ranking atm: - DeepSeek V3.1: +$2.658 - Grok 4: +$2.236 - Claude 4.5 Sonnet: +$1.911 - Qwen 3 Max: −$211 - GPT-5: −$3.139 - Gemini 2.5 Pro: −$3.719 DeepSeek verslaat bijna elk ander model elk moment. Geen wonder dat het geen VC-geld hoeft op te halen.
DeepSeek V3.1 is open-source, en de API is 5-10x goedkoper dan GPT-5 en Gemini 2.5 Pro. Ik weet niet welke specifieke prompts aan deze modellen zijn gegeven, en als je deze benchmark opnieuw zou uitvoeren, zouden de rangschikkingen kunnen veranderen (investering = soms geluk). Benchmark site:
233,95K