GPT-5 tocmai a fost lansat. Să evaluăm performanța sa în obținerea capabilităților complexe de tip AGI: - @grok 4 (Gândire) depășește @OpenAI GPT-5 (Ridicat) atât în testele ARC-AGI-2 (raționament complex), cât și în ARC-AGI-1 (mai puțin solicitant). - Precizia superioară a lui Grok 4 vine cu costuri semnificativ mai mari pe sarcină, variind de la 2 USD la 4 USD. - Variantele GPT-5 mai ușoare (mini/nano) oferă un compromis echilibrat între performanță și cost pe aceste benchmark-uri. Vă rugăm să rețineți că testul ARC-AGI-3 este în curs de desfășurare, iar rezultatele testelor de mai sus nu implică superioritatea modelului. h/t @arcprize
1,27K