Meta щойно поділилася препринтом про використання RL для посттренінгових LLM для генеративної реклами у Facebook, що підвищило ефективність реклами на 6,7%. • Перший LLM, навчений RL, розгорнутий у рекламній системі Facebook • Використовувані показники кліків оголошень як сигнал винагороди RL для точного налаштування тексту оголошення • Модель RL перевершила базовий рівень ефективності оголошень під наглядом із показником +6,7% CTR Посттренінг на основі метрики в цьому масштабі відкриває двері для більш широких застосувань. Цікаво подивитися, що з цього вийде.
3,84K