使新健身房/环境的创建民主化,而不仅仅是推出,是分布式 RL 真正让我兴奋的事情。看到@gensynai发布这个真的很酷!
gensyn
gensyn2025年6月26日
1/ 介绍 RL Swarm 的新后端:GenRL。 一个模块化的强化学习库,专为分布式容错训练而构建 - 现在从头开始为 RL Swarm 提供支持。🧵
772