Grok 4 è ancora all'avanguardia su ARC-AGI-2 tra i modelli di frontiera. 15,9% per Grok 4 contro 9,9% per GPT-5.
ARC Prize
ARC Prize8 ago, 01:29
GPT-5 su ARC-AGI Valutazione Semi Privata GPT-5 * ARC-AGI-1: 65.7%, $0.51/task * ARC-AGI-2: 9.9%, $0.73/task GPT-5 Mini * ARC-AGI-1: 54.3%, $0.12/task * ARC-AGI-2: 4.4%, $0.20/task GPT-5 Nano * ARC-AGI-1: 16.5%, $0.03/task * ARC-AGI-2: 2.5%, $0.03/task
474