Společnost Meta právě sdílela preprint o používání RL k post-trénování LLM pro generativní reklamy na Facebooku, který zvýšil výkon reklam o 6,7 %. • První LLM vyškolený v oblasti RL nasazený v reklamním systému Facebooku • Míra prokliku reklamy byla použita jako signál RL odměny pro doladění textu reklamy • RL model překonal základní stav výkonu reklamy s +6,7 % CTR Následné trénování řízené metrikami v tomto měřítku otevírá dveře širším aplikacím. Jsem zvědavý, kam se to bude ubírat dál.
3,8K