Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

GPT-OSS hoạt động kém ngay cả trên các tiêu chuẩn yêu cầu gọi công cụ thô. Ví dụ, CORE-Bench yêu cầu các tác nhân chạy các lệnh bash để tái tạo các bài báo khoa học. DeepSeek V3 đạt 18%. GPT-OSS đạt 11%.

6,09K

Hàng đầu

Thứ hạng

Yêu thích

Onchain thịnh hành

Thịnh hành trên X

Ví funding hàng đầu gần đây

Được chú ý nhất