騰訊 AI 實驗室推出 R-Zero! 一個開創性的框架,使 LLM 能夠從零人類策劃的數據中,自我演化其推理能力,通過自主的挑戰者-解決者循環。
74.38K