Saya bertanya-tanya seberapa berbeda rantai pemikiran gpt-oss dari yang nyata di belakang GPT-5. Sudahkah mereka menemukan skema RL tingkat o3 yang sepenuhnya terpisah untuk oss, hanya untuk tidak membiarkan alfa NYATA melarikan diri? Kalau tidak, mengapa lagu dan tarian yang rumit ini dengan sedikit jeda dan ringkasan paragraf?
2,25K