Grok 4 ist nach wie vor das Maß der Dinge auf ARC-AGI-2 unter den fortschrittlichen Modellen. 15,9 % für Grok 4 im Vergleich zu 9,9 % für GPT-5.
ARC Prize
ARC Prize8. Aug., 01:29
GPT-5 bei der semi-privaten Bewertung von ARC-AGI GPT-5 * ARC-AGI-1: 65,7 %, 0,51 $/Aufgabe * ARC-AGI-2: 9,9 %, 0,73 $/Aufgabe GPT-5 Mini * ARC-AGI-1: 54,3 %, 0,12 $/Aufgabe * ARC-AGI-2: 4,4 %, 0,20 $/Aufgabe GPT-5 Nano * ARC-AGI-1: 16,5 %, 0,03 $/Aufgabe * ARC-AGI-2: 2,5 %, 0,03 $/Aufgabe
483