Hver gang vi trener en flott ny modell, må jeg febrilsk prøve å skrive en ny take-home som modellen ikke kan overvinne, slik at vi fortsatt kan ansette etter lansering. Denne var tøff, mange utkast basert på reelle problemer falt for Claude Codes «ultrathink» og måtte skrotes.