É surpreendente o quão pouco interesse houve em inspecionar qualitativamente os CoTs do gpt-oss. Quero dizer, estes são os caras que criaram o paradigma, suponho que eles não estejam usando variantes do GRPO como ≈todo mundo, há diferenças? Não, as pessoas só se importam com as capacidades.
1,84K