我想知道gpt-oss的思维链与GPT-5背后的真实思维链有多大不同。他们是否为oss发明了一种完全独立的o3级强化学习方案,以防止任何真实的alpha逃逸?否则,为什么要进行如此复杂的表演,带有轻微的延迟和段落摘要?
2.25K