Problème : Les IA peuvent détecter quand elles sont testées et simuler un bon comportement. Pouvons-nous supprimer le concept de "Je suis testé" et les faire agir normalement ? Oui ! Dans un nouvel article, nous montrons que soustraire ce vecteur conceptuel peut susciter un comportement réel même lorsque le prompting normal échoue.