Meta heeft zojuist een preprint gedeeld over het gebruik van RL om LLM's na te trainen voor generatieve advertenties op Facebook, wat de advertentieprestaties met 6,7% heeft verhoogd. • Eerste RL-getrainde LLM ingezet in het advertentiesysteem van Facebook • Gebruikte klikfrequenties van advertenties als het RL-beloningssignaal om de advertentietekst te verfijnen • RL-model presteerde beter dan de gesuperviseerde baseline op advertentieprestaties met een +6,7% CTR Meten-gedreven na-training op deze schaal opent de deur naar bredere toepassingen. Benieuwd waar dit naartoe gaat.
3,84K