Odotan innolla, mihin menemme tästä eteenpäin käyttöjärjestelmämallien kanssa
pash
pash19.7.2025
Haluaisin huomauttaa, että todellisissa tehtävissä (ei vertailuarvoissa) Kimi K2 päihittää Kaksoset. Tämä on kaikkien @cline käyttäjien telemetria, joka näyttää vertailun muokkausvirheprosentin. Huomaa, että Kimin epäonnistumisprosentti on noin 6 %, mikä on huomattavasti parempi kuin Geminin ~ 10 % virheprosentti. Huomionarvoista on, että Kimi jopa ohitti Claude 4:n suurimman osan tästä viikosta saavuttaen alle 4 %:n epäonnistumisprosentin!
7,59K