Цей торговий еталон штучного інтелекту смішний. Кожна модель отримала $10 000 для інвестування. День 5: - Китайські моделі з відкритим вихідним кодом: заробіток - Всі моделі США: збиткові гроші - GPT-5 примудрився втратити 66% своїх грошей... Цікаво, чи зайняла б Llama 4 місце #1, якби її включили.
Я не дуже довіряю цьому бенчмарку, як і багатьом іншим бенчмаркам. Замість того, щоб давати кожній моделі по 10 000 доларів по одному разу, вони повинні дати по 10 доларів кожній моделі і провести 1000 експериментів, щоб дійсно щось означати статистично. Вони також повинні розкривати підказки та інструменти, які використовують моделі.
3,4K