Penelitian pertama tentang dasar-dasar pelatihan karakter - yaitu menerapkan teknik pasca pelatihan modern untuk menanamkan ciri-ciri karakter tertentu ke dalam model. Semua model, kumpulan data, kode, dll dirilis. Sangat bersemangat dengan proyek ini! Sharan sangat menyenangkan untuk bekerja sama.
Sharan
Sharan4 Nov, 22.09
AI yang "dipaksa untuk menjadi baik" vs "benar-benar baik" Haruskah kita peduli dengan perbedaannya? (Iya!) Kami merilis implementasi terbuka pertama dari pelatihan karakter. Kami membentuk persona asisten AI dengan cara yang lebih kuat daripada alternatif seperti prompting atau activation steering.
Bagi orang-orang yang mengikuti saya untuk sementara waktu, Anda tahu ini telah ada di radar saya sebagai area yang sangat kurang dipelajari, sebagai sesuatu yang semakin berdampak pada penyebaran model yang mutakhir, tidak dipelajari di akademis, tetapi dapat diakses dalam biaya. Berharap untuk menyemai bidang penelitian kecil di sini!
Orang-orang yang telah lama saya kagumi untuk ini sebagai menciptakan bidang pelatihan karakter (secara publik, pasti lebih banyak berkontribusi): @AmandaAskell, @joannejang, dan @johnschulman2
38,57K