观看Echo训练的30B Sokoban模型超越许多规模更大的模型,包括DeepSeek-R1和GPT-OSS-120B。 Echo不依赖于更大的数据中心或更昂贵的GPU集群,而是利用随处可见的消费硬件来扩展强化学习。
45.1K