xAI telah meningkatkan model mereka yang cepat, murah, dan berfokus pada agen ke Grok 4.1 Cepat, melonjak +4 poin pada Indeks Kecerdasan Analisis Buatan Kesimpulan utama: ➤ Performa agen terkemuka: Grok 4.1 Fast with reasoning menempati posisi teratas di Papan Peringkat Telecom τ²-Bench kami dengan skor 93,3%, tepat di depan Kimi K2 Thinking, dan mewakili peningkatan +27 poin dibandingkan Grok 4 Fast ➤ Perbatasan Intelijen Pareto: Seperti pendahulunya, Grok 4.1 Fast menawarkan kecerdasan terkemuka dengan biaya rendah - hanya 1 poin di belakang Grok 4 di Indeks Intelijen dengan biaya per token ~30x lebih rendah. Ini menempatkan Grok 4.1 Fast dengan kuat di kuadran paling menarik dari Indeks Intelijen kami versus perbandingan biaya ➤ Peningkatan inkremental yang jelas: Bersamaan dengan peningkatan untuk agen dan panggilan alat ini, Grok 4.1 Fast mempertahankan kekuatan pendahulunya: harga rendah ($0,2/0,5 per juta token, input/output token), jendela konteks besar (2 juta token), dan efisiensi token Selamat kepada tim @xai dan @elonmusk atas rilis baru ini! Lihat di bawah untuk analisis lebih lanjut
Grok 4.1 Fast mencapai 64 pada Indeks Kecerdasan Analisis Buatan, 4 poin lebih tinggi dari Grok 4, menjadikannya peningkatan yang jelas dari pendahulunya
Grok 4.1 Fast mengambil 71 juta token untuk menyelesaikan evaluasi Indeks Kecerdasan Analisis Buatan dengan biaya $45, mirip dengan Grok 4 dan secara signifikan lebih sedikit di kedua akun daripada kebanyakan model terkemuka lainnya
Hasil benchmark individu: MMLU-Pro, GPQA Diamond, Ujian Terakhir Kemanusiaan, LiveCodeBench, SciCode, AIME 2025, IFBench, AA-LCR, Terminal-Bench Hard, τ²-Bench Telecom
Lihat halaman model kami untuk analisis lebih lanjut tentang kinerja, biaya, dan kemampuan Grok 4.1 Fast
55,57K