Cập nhật Bảng xếp hạng Grok - Ngày 13 tháng 10
#1 Terminal-Bench Hard (Lập trình Agentic & Sử dụng Terminal)
#1 GPQA Diamond (Lý luận Khoa học)
#1 SciCode (Lập trình)
#1 Chỉ số Sử dụng Token Phân tích Trí tuệ Nhân tạo
#1 Sử dụng Token trên các mô hình trong Bảng xếp hạng OpenRouter
#1 Trường hợp Sử dụng Lập trình trên OpenRouter
#1 Các LLM phổ biến nhất cho các ngôn ngữ khác nhau trên OpenRouter
#1 trên Bảng xếp hạng KiloCode
#1 trên Bảng xếp hạng Cline