Tencent AI Lab introduserer R-Zero! Et banebrytende rammeverk som gjør det mulig for LLM-er å utvikle sine resonneringsevner selv fra null menneskekuraterte data, gjennom en autonom Challenger-Solver-sløyfe.
74,39K