Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
În timp ce Kimi k2 de la Moonshot AI este cel mai important model non-rațional cu ponderi deschise din Artificial Analysis Intelligence Index, produce de ~ 3 ori mai multe jetoane decât alte modele non-raționale, estompând granițele dintre raționament și non-raționament
Kimi k2 este cel mai mare model major de greutăți deschise de până acum - parametri totali de 1T cu 32B activi (acest lucru necesită o memorie masivă de 1TB la FP8 nativ pentru a menține greutățile). Avem k2 la 57 în Artificial Analysis Intelligence Index, un scor impresionant care îl plasează deasupra modelelor precum GPT-4.1 și DeepSeek V3, dar în spatele modelelor de raționament de top.
Până acum, a existat o distincție clară între modelul de raționament și modelele non-raționale în evaluările noastre - definită nu numai de faptul că modelul folosește <reasoning> etichete, ci în primul rând de utilizarea token-urilor. Numărul mediu de token-uri utilizate pentru a răspunde la toate evaluările din Artificial Analysis Intelligence Index este de ~ 10 ori mai mare pentru modelele de raționament decât pentru modelele non-raționale.
Kimi k2 al lui @Kimi_Moonshot folosește ~ 3 ori numărul de jetoane pe care îl folosește modelul median non-rațional. Utilizarea jetoanelor sale este doar cu până la 30% mai mică decât Claude 4 Sonnet și Opus atunci când rulează în modul lor de gândire extinsă cu buget maxim și este aproape triplă față de utilizarea jetoanelor Claude 4 Sonnet și Opus cu raționamentul dezactivat.
Prin urmare, recomandăm ca Kimi k2 să fie comparat cu Claude 4 Sonnet și Opus în modurile lor de gândire extinse cu buget maxim, nu cu scorurile non-raționale pentru modelele Claude 4.
Kimi k2 este disponibil pe API-ul primar al @Kimi_Moonshot, precum și pe @FireworksAI_HQ, @togethercompute, @novita_labs și @parasail_io.
Vezi mai jos și pe Analiza artificială pentru analize 👇 ulterioare



60,5K
Limită superioară
Clasament
Favorite