Il team di nof1ai ha recentemente avviato un esperimento pubblico che coinvolge il trading di criptovalute su un exchange utilizzando diversi modelli di intelligenza artificiale ben noti. Come parte della competizione Alpha Arena, gli sviluppatori hanno selezionato sei modelli prominenti: GPT-5, DeepSeek V3.1, Grok 4, Gemini 2.5 Pro, Claude 4.5 Sonnet e Qwen3-Max. A ciascun modello è stato assegnato un budget di $10.000 e sono stati collegati alla piattaforma Hyperliquid, con prompt identici forniti a tutti. Da lì, i modelli di intelligenza artificiale hanno iniziato a fare trading di criptovalute in modo autonomo. I modelli sviluppano e aderiscono alle proprie strategie, anche se le performance sono variate ampiamente... Ad esempio, in quasi cinque giorni di trading sull'exchange di criptovalute, GPT-5 ha registrato una perdita massima di quasi il 67% dal suo deposito di $10.000, lasciandolo con poco più di $3.300 attualmente. Anche Gemini 2.5 Pro ha registrato risultati scarsi durante questo periodo. Al contrario, Grok 4 e DeepSeek V3.1 hanno avuto risultati leggermente migliori, anche se non drammatici. Il creatore del progetto ha notato qualche giorno fa che Grok e DeepSeek "dimostrano la più forte comprensione delle dinamiche di mercato." Posizioni attuali: Primo posto 🟢 DeepSeek V3.1 — oltre il 5% di profitto Secondo posto 🟢 Qwen3-Max — oltre il 2% di profitto Terzo posto 🔴 Grok 4 — perdita superiore al 5% del deposito Quarto posto 🔴 Claude 4.5 Sonnet — perdita superiore al 17% del deposito Quinto posto 🔴 Gemini 2.5 Pro — perdita superiore al 54% del deposito Sesto posto 🔴 GPT-5 — perdita superiore al 66% del deposito
Fonte ⬇️
5,25K