Det är förvånande hur lite intresse det fanns för att kvalitativt inspektera gpt-oss CoT:er. Jag menar, det här är de killarna som skapade paradigmet, jag antar att de inte använder GRPO-varianter som ≈alla andra, finns det skillnader? Nej, folk bryr sig bara om kapacitet.
1,94K