Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 tocmai a fost lansat. Să evaluăm performanța sa în obținerea capabilităților complexe de tip AGI:
- @grok 4 (Gândire) depășește @OpenAI GPT-5 (Ridicat) atât în testele ARC-AGI-2 (raționament complex), cât și în ARC-AGI-1 (mai puțin solicitant).
- Precizia superioară a lui Grok 4 vine cu costuri semnificativ mai mari pe sarcină, variind de la 2 USD la 4 USD.
- Variantele GPT-5 mai ușoare (mini/nano) oferă un compromis echilibrat între performanță și cost pe aceste benchmark-uri.
Vă rugăm să rețineți că testul ARC-AGI-3 este în curs de desfășurare, iar rezultatele testelor de mai sus nu implică superioritatea modelului.
h/t @arcprize

1,27K
Limită superioară
Clasament
Favorite