Es ist überraschend, wie wenig Interesse es an der qualitativen Inspektion von gpt-oss CoTs gab. Ich meine, das sind die Leute, die das Paradigma geschaffen haben, ich schätze, sie verwenden keine GRPO-Varianten wie ≈alle anderen, gibt es Unterschiede? Nein, die Leute interessieren sich nur für die Fähigkeiten.
1,85K