Suspeito que o raciocínio generalizado foi resolvido há apenas algumas semanas e passou completamente despercebido. HRM, um novo arco, supostamente tem resultados SOTA em benchmarks ARC-AGI 1 e 2 com apenas 27 milhões de parâmetros e ~ 1k exemplos de treinamento.
166,75K