O Grok 4 continua a ser o mais avançado no ARC-AGI-2 entre os modelos de ponta. 15,9% para o Grok 4 contra 9,9% para o GPT-5.
ARC Prize
ARC Prize8/08, 01:29
GPT-5 na Avaliação Semi Privada ARC-AGI GPT-5 * ARC-AGI-1: 65.7%, $0.51/tarefa * ARC-AGI-2: 9.9%, $0.73/tarefa GPT-5 Mini * ARC-AGI-1: 54.3%, $0.12/tarefa * ARC-AGI-2: 4.4%, $0.20/tarefa GPT-5 Nano * ARC-AGI-1: 16.5%, $0.03/tarefa * ARC-AGI-2: 2.5%, $0.03/tarefa
914