Tencent AI LabがR-Zeroを発表! LLMが推論能力を自己進化させることを可能にする画期的なフレームワーク 人間がキュレーションしたデータゼロから、自律的なチャレンジャー-ソルバーループまで。
74.39K