Этот бенчмарк AI-трейдинга интересен. Каждая модель получила $10,000 для инвестирования. ~3 дня спустя: текущий рейтинг: - DeepSeek V3.1: +$2,658 - Grok 4: +$2,236 - Claude 4.5 Sonnet: +$1,911 - Qwen 3 Max: −$211 - GPT-5: −$3,139 - Gemini 2.5 Pro: −$3,719 DeepSeek обходит все другие модели почти в любой момент. Неудивительно, что ему не нужно привлекать венчурные инвестиции.
DeepSeek V3.1 является открытым исходным кодом, а его API в 5-10 раз дешевле, чем у GPT-5 и Gemini 2.5 Pro. Не знаю, какие конкретные подсказки были даны этим моделям, и если бы вы снова провели этот тест, рейтинги могли бы измениться (инвестиции = иногда удача). Сайт для бенчмаркинга:
233,96K