Sangat mengejutkan betapa sedikit minat yang ada dalam memeriksa CoT gpt-oss secara kualitatif. Maksud saya, ini adalah orang-orang yang menciptakan paradigma, saya kira mereka tidak menggunakan varian GRPO seperti ≈orang lain, apakah ada perbedaan? Tidak, orang hanya peduli dengan kemampuan.
1,94K