令人惊讶的是,几乎没有人对定性检查gpt-oss的CoTs感兴趣。我是说,他们是创造这一范式的人,我想他们并不像≈其他人那样使用GRPO变体,是不是有区别? 不,人们只关心能力。
1.84K