molto entusiasta di vedere dove andremo da qui con i modelli OS
pash
pash19 lug 2025
Vorrei sottolineare che per le attività del mondo reale (non per i benchmark), Kimi K2 supera Gemini. Si tratta di dati di telemetria per tutti gli utenti @cline, che mostrano la frequenza di errore di modifica delle differenze. Si noti come Kimi abbia un tasso di errore di circa il 6%, che è significativamente migliore del tasso di errore ~ 10% di Gemini. Sorprendentemente, Kimi ha persino superato Claude 4 per la maggior parte di questa settimana, raggiungendo un tasso di fallimento inferiore al 4%!
7,58K