Es sorprendente el poco interés que había en inspeccionar cualitativamente los CoTs de gpt-oss. Quiero decir, estos son los que crearon el paradigma, supongo que no están usando variantes de GRPO como ≈todo el mundo, ¿hay diferencias? No, a la gente solo le importan las capacidades.
1,94K