Toda vez que treinamos um modelo novo e ótimo, preciso tentar freneticamente escrever um novo take-home que o modelo não consiga derrotar para ainda podermos contratar após o lançamento. Este foi difícil, muitos rascunhos baseados em problemas reais caíram antes do "ultrapensamento" de Claude Code e precisaram ser descartados.