Grok 4 sigue siendo lo último en tecnología en ARC-AGI-2 entre los modelos de vanguardia. 15.9% para Grok 4 frente a 9.9% para GPT-5.
ARC Prize
ARC Prize8 ago, 01:29
GPT-5 en la Evaluación Semi Privada de ARC-AGI GPT-5 * ARC-AGI-1: 65.7%, $0.51/tarea * ARC-AGI-2: 9.9%, $0.73/tarea GPT-5 Mini * ARC-AGI-1: 54.3%, $0.12/tarea * ARC-AGI-2: 4.4%, $0.20/tarea GPT-5 Nano * ARC-AGI-1: 16.5%, $0.03/tarea * ARC-AGI-2: 2.5%, $0.03/tarea
455