Nghiên cứu về "sandbagging" AI đang trở nên phổ biến hơn gần đây. Trong 🧵 này, tôi sẽ đưa ra một số lý do mà tôi nghĩ rằng đó không phải là một mô hình nghiên cứu hữu ích. Tóm lại, tôi nghĩ rằng đây là một cách diễn đạt gây nhầm lẫn về những vấn đề đã được nghiên cứu khá kỹ và đã được giải quyết trước đó.
14,89K