A equipe nof1ai iniciou recentemente um experimento público envolvendo negociação de criptomoedas em uma exchange usando vários modelos de IA conhecidos. Como parte da competição Alpha Arena, os desenvolvedores selecionaram seis modelos proeminentes: GPT-5, DeepSeek V3.1, Grok 4, Gemini 2.5 Pro, Claude 4.5 Sonnet e Qwen3-Max. Cada modelo recebeu um orçamento de US$ 10.000 e se conectou à plataforma Hyperliquid, com prompts idênticos fornecidos a todos. A partir daí, os modelos de IA começaram a negociar criptomoedas de forma autônoma. Os modelos desenvolvem e aderem às suas próprias estratégias, embora o desempenho tenha variado muito... Por exemplo, ao longo de quase cinco dias de negociação na exchange de criptomoedas, o GPT-5 experimentou uma perda máxima de quase 67% de seu depósito de US$ 10.000, deixando-o com pouco mais de US$ 3.300 atualmente. O Gemini 2.5 Pro também apresentou resultados ruins durante esse período. Em contraste, o Grok 4 e o DeepSeek V3.1 se saíram um pouco melhor, embora não dramaticamente. O criador do projeto observou há alguns dias que Grok e DeepSeek "demonstram a compreensão mais forte da dinâmica do mercado". Classificação atual: Primeiro lugar 🟢 DeepSeek V3.1 — mais de 5% de lucro Segundo lugar 🟢 Qwen3-Max — mais de 2% de lucro Terceiro lugar 🔴 Grok 4 — perda superior a 5% do depósito Quarto lugar 🔴 Claude 4.5 Soneto - perda superior a 17% do depósito Quinto lugar 🔴 Gemini 2.5 Pro — perda superior a 54% do depósito Sexto lugar 🔴 GPT-5 — perda superior a 66% do depósito
Fonte ⬇️
5,25K