Das Zwingen von LLMs, während des Trainings böse zu sein, kann sie langfristig netter machen.
6,57K