O Tencent AI Lab apresenta o R-Zero! Uma estrutura inovadora que permite que os LLMs evoluam autonomamente as suas capacidades de raciocínio a partir de zero dados curados por humanos, através de um ciclo autônomo Challenger-Solver.
75,81K