Tencent AI Lab giới thiệu R-Zero! Một khung công tác đột phá cho phép LLM tự phát triển khả năng lý luận của chúng từ dữ liệu do con người biên soạn không có, thông qua một vòng lặp Challenger-Solver tự động.
75,81K