Thật bất ngờ khi có rất ít sự quan tâm đến việc kiểm tra chất lượng các CoTs của gpt-oss. Ý tôi là, đây là những người đã tạo ra mô hình, tôi đoán họ không sử dụng các biến thể GRPO như ≈mọi người khác, có sự khác biệt nào không? Không, mọi người chỉ quan tâm đến khả năng.
1,84K