Forzar a los LLM a ser malvados durante el entrenamiento puede hacer que sean más amables a largo plazo.
6.57K