Penelitian tentang AI "sandbagging" semakin populer akhir-akhir ini. Dalam hal ini 🧵, saya akan memberikan beberapa alasan yang menurut saya bukan paradigma penelitian yang berguna. TL; DR, saya pikir ini adalah pembingkaian ulang yang membingungkan dari masalah yang dipelajari dengan cukup baik dan dipecahkan sebelumnya.
14,89K