Nghiên cứu mới của Anthropic: "Tỉ lệ nghịch trong tính toán thời gian kiểm tra" Chúng tôi đã phát hiện ra những trường hợp mà việc suy luận lâu hơn dẫn đến độ chính xác thấp hơn. Những phát hiện của chúng tôi cho thấy việc mở rộng tính toán thời gian kiểm tra một cách ngây thơ có thể vô tình củng cố các mô hình suy luận có vấn đề. 🧵
143,39K