Grok 4 je stále nejmodernější na ARC-AGI-2 mezi hraničními modely. 15,9 % pro Grok 4 vs. 9,9 % pro GPT-5.
ARC Prize
ARC Prize8. 8. 01:29
GPT-5 na ARC-AGI Semi Private Eval GPT-5 * ARC-AGI-1: 65,7 %, 0,51 $/úkol * ARC-AGI-2: 9,9 %, 0,73 $/úkol GPT-5 Mini * ARC-AGI-1: 54,3 %, 0,12 $/úkol * ARC-AGI-2: 4,4 %, 0,20 $/úloha GPT-5 Nano * ARC-AGI-1: 16,5 %, 0,03 $/úloha * ARC-AGI-2: 2,5 %, 0,03 $/úloha
467