使新健身房/環境的創建民主化,而不僅僅是推出,是分散式 RL 真正讓我興奮的事情。看到@gensynai發布這個真的很酷!
gensyn
gensyn2025年6月26日
1/ 介紹 RL Swarm 的新後端:GenRL。 一個模組化強化學習庫,專為分散式容錯訓練而建置,現在從頭開始為 RL Swarm 提供支援。🧵
771