heel enthousiast om te zien waar we hierna naartoe gaan met os-modellen
pash
pash19 jul 2025
Ik wil erop wijzen dat Kimi K2 voor de taken in de echte wereld (geen benchmarks) beter presteert dan Gemini. Dit is telemetrie voor alle @cline gebruikers, die het mislukte bewerkingspercentage van het verschil laat zien. Merk op dat Kimi een faalpercentage van ongeveer 6% heeft, wat aanzienlijk beter is dan het foutenpercentage van ~ 10% van Gemini. Opmerkelijk genoeg overtrof Kimi zelfs het grootste deel van deze week Claude 4, met een faalpercentage van minder dan 4%!
7,59K