Grok 4 все ще є найсучаснішим на ARC-AGI-2 серед передових моделей. 15,9% для Grok 4 проти 9,9% для GPT-5.
ARC Prize
ARC Prize8 серп., 01:29
GPT-5 на ARC-AGI Semi Private Eval ЗПТ-5 * ARC-AGI-1: 65,7%, 0,51 $/завдання * ARC-AGI-2: 9,9%, $0,73/завдання GPT-5 Міні * ARC-AGI-1: 54,3%, $0,12/завдання * ARC-AGI-2: 4,4%, 0,20 $/завдання GPT-5 Нано * ARC-AGI-1: 16,5%, 0,03 $/завдання * ARC-AGI-2: 2,5%, $0,03/завдання
460