Onderzoek naar AI "sandbagging" wordt de laatste tijd steeds populairder. In deze 🧵 zal ik enkele redenen geven waarom ik denk dat het geen nuttig onderzoeksparadigma is. TL;DR, ik denk dat het een verwarrende herformulering is van vrij goed bestudeerde en eerder opgeloste problemen.
14,9K