喜歡 @DeepCogito 使用自我對弈來構建其模型——結果發現這使得模型在推理和非思考模式下都變得更好。 向 @drishanarora 和 @DeepCogito 團隊致敬!