Varje gång vi tränar en bra ny modell måste jag febrilt försöka skriva en ny slutsats som modellen inte kan slå så att vi ändå kan anställa efter lanseringen. Den här var tuff, många utkast baserade på verkliga problem föll för Claude Codes "ultrathink" och behövde skrotas.