Suspeito que o raciocínio generalizado foi resolvido há apenas algumas semanas e voou completamente fora do radar. HRM, um novo arco, supostamente tem resultados SOTA em benchmarks ARC-AGI 1 & 2 com apenas 27 milhões de parâmetros e ~1k exemplos de treinamento.
166,74K