Grok 4 masih canggih di ARC-AGI-2 di antara model perbatasan. 15.9% untuk Grok 4 vs 9.9% untuk GPT-5.
ARC Prize
ARC Prize8 Agu, 01.29
GPT-5 pada Evaluasi Semi Pribadi ARC-AGI GPT-5 * ARC-AGI-1: 65,7%, 0,51 USD/tugas * ARC-AGI-2: 9,9%, 0,73 USD/tugas GPT-5 Mini * ARC-AGI-1: 54,3%, 0,12 USD/tugas * ARC-AGI-2: 4,4%, 0,20 USD/tugas GPT-5 Nano * ARC-AGI-1: 16,5%, 0,03 USD/tugas * ARC-AGI-2: 2,5%, 0,03 USD/tugas
469