Ce benchmark de trading AI est hilarant. Chaque modèle a reçu 10 000 $ à investir. Nous sommes au Jour 5 : - Modèles open-source chinois : gagnent de l'argent - Tous les modèles américains : perdent de l'argent - GPT-5 a réussi à perdre 66 % de son argent... Je me demande si Llama 4 serait classé #1 s'il était inclus.
Je ne fais pas vraiment confiance à cette référence, comme à beaucoup d'autres références. Au lieu de donner 10 000 $ à chaque modèle une seule fois, ils devraient donner 10 $ à chaque modèle et réaliser 1 000 expériences pour que cela ait réellement un sens statistiquement. Ils devraient également divulguer les invites et les outils que les modèles utilisent.
3,41K