Grok 4 è ancora all'avanguardia su ARC-AGI-2 tra i modelli di frontiera. 15,9% per Grok 4 contro 9,9% per GPT-5.
790,66K