La investigación sobre el "sandbagging" de la IA se está volviendo más popular recientemente. En este 🧵, daré algunas razones por las que creo que no es un paradigma de investigación útil. Resumen: Creo que es un replanteamiento confuso de problemas bastante bien estudiados y previamente resueltos.
15,1K