O Grok 4 ainda é o estado da arte no ARC-AGI-2 entre os modelos de fronteira. 15,9% para Grok 4 vs 9,9% para GPT-5.
790,68K