Мне интересно, насколько отличаются цепочки размышлений gpt-oss от реальных, стоящих за GPT-5. Они придумали совершенно отдельную схему RL третьего уровня для oss, чтобы не дать уйти никакому РЕАЛЬНОМУ альфа? В противном случае, зачем эта сложная игра с небольшими задержками и резюме абзацев?
2,26K