不要讓 @NousResearch 的開源發布被你們忽視。 NousCoder-14B 是一個競爭性編程模型,在 LiveCodeBench 上提升了 7%,並且僅在 4 天內訓練完成。 開源的強化學習編程現在大幅升級。