Ich frage mich, wie unterschiedlich die Denkweisen der gpt-oss von den echten hinter GPT-5 sind. Haben sie ein völlig separates, o3-stufiges RL-Schema für oss erfunden, nur um zu verhindern, dass irgendein ECHTER Alpha entkommt? Andernfalls, warum dieser aufwendige Tanz mit einer leichten Verzögerung und Absatzzusammenfassungen?
2,25K