Việc ép các mô hình ngôn ngữ lớn (LLMs) trở nên xấu xa trong quá trình huấn luyện có thể khiến chúng trở nên tốt đẹp hơn trong dài hạn.
6,57K