Me pregunto cuán diferentes son las cadenas de pensamiento de gpt-oss de las reales detrás de GPT-5. ¿Han inventado un esquema de RL de nivel o3 completamente separado para oss, solo para no dejar escapar ningún REAL alpha? De lo contrario, ¿por qué esta elaborada canción y baile con un ligero retraso y resúmenes de párrafos?
2.25K