Anledningen till att Cursor och Windsurf släppte modeller som är optimerade för hastighet är att det är mycket mer genomförbart än att bygga en grundläggande modell som trycker på intelligensen 1. Ta Qwen3 och finjustera den via RL på din sele 2. slå den på Cerebras (eller optimerad GPU) hårdvara 3. Låt den medelsmarta, supersnabba modellen laga mat Om du vill tillföra något av värde till marknaden för kodningsagenter är det flera storleksordningar svårare att skapa en ny grundläggande modell än att finjustera en öppen modell och optimera slutsatsdragningen. ärligt talat är det det effektiva sättet att släppa något som närmar sig pareto-gränsen och jag gillar att kodningsagentföretag börjar delta. Men missta inte detta för att koda agentföretag som förklarar "Medium Smart But Rapid > Highly Smart But Slow"