Этот бенчмарк AI-трейдинга просто смешной. Каждая модель получила $10,000 для инвестирования. День 5: - Китайские открытые модели: зарабатывают деньги - Все модели из США: теряют деньги - GPT-5 удалось потерять 66% своих средств... Интересно, занял бы Llama 4 первое место, если бы его включили.
Я не очень доверяю этому бенчмарку, как и многим другим бенчмаркам. Вместо того чтобы давать каждой модели $10,000 один раз, им следует дать $10 каждой модели и провести 1,000 экспериментов, чтобы это действительно имело статистическое значение. Им также следует раскрыть подсказки и инструменты, которые используют модели.
3,4K