¡Tencent AI Lab presenta R-Zero! Un marco innovador que permite a los LLMs auto-evolucionar sus capacidades de razonamiento a partir de cero datos curados por humanos, a través de un bucle autónomo de Desafiante-Solucionador.
75.78K