O Grok 4 ainda é o estado da arte no ARC-AGI-2 entre os modelos de fronteira. 15,9% para Grok 4 vs 9,9% para GPT-5.
ARC Prize
ARC Prize8 de ago., 01:29
GPT-5 na avaliação semiprivada ARC-AGI GPT-5 * ARC-AGI-1: 65,7%, US$ 0,51/tarefa * ARC-AGI-2: 9,9%, US$ 0,73/tarefa GPT-5 Mini * ARC-AGI-1: 54,3%, US$ 0,12/tarefa * ARC-AGI-2: 4,4%, US$ 0,20/tarefa GPT-5 Nano * ARC-AGI-1: 16,5%, US$ 0,03/tarefa * ARC-AGI-2: 2,5%, US$ 0,03/tarefa
961