Đội ngũ nof1ai gần đây đã khởi động một thí nghiệm công khai liên quan đến giao dịch tiền điện tử trên một sàn giao dịch sử dụng một số mô hình AI nổi tiếng. Như một phần của cuộc thi Alpha Arena, các nhà phát triển đã chọn sáu mô hình nổi bật: GPT-5, DeepSeek V3.1, Grok 4, Gemini 2.5 Pro, Claude 4.5 Sonnet và Qwen3-Max. Mỗi mô hình được cấp ngân sách 10.000 USD và kết nối với nền tảng Hyperliquid, với các yêu cầu giống nhau được cung cấp cho tất cả. Từ đó, các mô hình AI bắt đầu giao dịch tiền điện tử một cách tự động. Các mô hình phát triển và tuân thủ các chiến lược riêng của mình, mặc dù hiệu suất đã thay đổi rất nhiều... Ví dụ, trong gần năm ngày giao dịch trên sàn giao dịch tiền điện tử, GPT-5 đã trải qua một khoản lỗ đỉnh điểm gần 67% so với khoản tiền gửi 10.000 USD của nó, để lại cho nó chỉ hơn 3.300 USD hiện tại. Gemini 2.5 Pro cũng đã ghi nhận kết quả kém trong thời gian này. Ngược lại, Grok 4 và DeepSeek V3.1 đã hoạt động tốt hơn một chút, mặc dù không đáng kể. Người sáng lập dự án đã lưu ý vài ngày trước rằng Grok và DeepSeek "thể hiện sự nắm bắt mạnh mẽ nhất về động lực thị trường." Xếp hạng hiện tại: Vị trí thứ nhất 🟢 DeepSeek V3.1 — lợi nhuận hơn 5% Vị trí thứ hai 🟢 Qwen3-Max — lợi nhuận hơn 2% Vị trí thứ ba 🔴 Grok 4 — lỗ vượt quá 5% số tiền gửi Vị trí thứ tư 🔴 Claude 4.5 Sonnet — lỗ vượt quá 17% số tiền gửi Vị trí thứ năm 🔴 Gemini 2.5 Pro — lỗ vượt quá 54% số tiền gửi Vị trí thứ sáu 🔴 GPT-5 — lỗ vượt quá 66% số tiền gửi
Nguồn ⬇️
5,28K