Tencent AI Lab memperkenalkan R-Zero! Kerangka kerja inovatif yang memungkinkan LLM untuk mengembangkan kemampuan penalaran mereka sendiri dari nol data yang dikuratori manusia, melalui loop Challenger-Solver otonom.
74,39K