Meta baru saja membagikan pracetak tentang penggunaan RL untuk pasca-melatih LLM untuk iklan generatif di Facebook yang meningkatkan kinerja iklan sebesar 6,7%. • LLM terlatih RL pertama yang diterapkan dalam sistem iklan Facebook • Menggunakan rasio klik-tayang iklan sebagai sinyal hadiah RL untuk menyempurnakan teks iklan • Model RL mengungguli performa iklan yang diawasi dengan CTR +6,7% Pasca-pelatihan berbasis metrik pada skala ini membuka pintu untuk aplikasi yang lebih luas. Penasaran ingin melihat ke mana ini selanjutnya.
3,85K