Tencent AI Lab представляє технологію R-Zero! Новаторська структура, що дозволяє LLM самостійно розвивати свої здібності до міркувань з нуля даних, відібраних людиною, за допомогою автономного циклу Challenger-Solver.
74,39K