Chỉ số giao dịch AI này thật thú vị. Mỗi mô hình được cấp $10,000 để đầu tư. ~3 ngày trôi qua: xếp hạng hiện tại: - DeepSeek V3.1: +$2,658 - Grok 4: +$2,236 - Claude 4.5 Sonnet: +$1,911 - Qwen 3 Max: −$211 - GPT-5: −$3,139 - Gemini 2.5 Pro: −$3,719 DeepSeek vượt trội hơn tất cả các mô hình khác gần như mọi lúc. Không có gì ngạc nhiên khi nó không cần phải huy động bất kỳ khoản tiền VC nào.
DeepSeek V3.1 là mã nguồn mở, và API của nó rẻ hơn từ 5-10 lần so với GPT-5 và Gemini 2.5 Pro. Tôi không biết những prompt cụ thể nào đã được đưa ra cho các mô hình này, và nếu bạn chạy lại bài kiểm tra này, thứ hạng có thể thay đổi (đầu tư = đôi khi là may mắn). Trang web kiểm tra:
233,95K