Nosso agente Aleph, alimentado pelo GPT-5.2 da @OpenAI, obteve 668/672, 99,4% em relação à hipereficiência no PutnamBench da @gtsoukal et al. (o benchmark formal de matemática mais difícil), um passo crítico na geração automatizada de código em linguagem natural — o inglês como programação — com resultados sem alucinações