isso sempre esteve errado - mas agora categoricamente errado na era do RL em domínios verificáveis Os modelos buscam a verdade e até interagem com um mundo exterior difícil por meio do uso de ferramentas