我想知道 gpt-oss 的思維鏈與 GPT-5 背後的真實思維鏈有多大不同。他們是否為 oss 發明了一個完全獨立的、o3 級別的強化學習方案,以防止任何真正的 alpha 逃脫?否則,為什麼要這樣精心安排的表演,還有輕微的延遲和段落摘要?
2.25K