Pergunto-me quão diferentes são as cadeias de pensamento do gpt-oss das reais por trás do GPT-5. Inventaram um esquema de RL de nível o3 totalmente separado para oss, apenas para não deixar escapar nenhum REAL alpha? Caso contrário, por que essa elaborada dança com um ligeiro atraso e resumos de parágrafo?
2,25K