Meta hat gerade einen Preprint veröffentlicht, der die Verwendung von RL zur Nachschulung von LLMs für generative Anzeigen auf Facebook beschreibt, was die Anzeigenleistung um 6,7 % gesteigert hat. • Erstes RL-trainiertes LLM, das im Anzeigensystem von Facebook eingesetzt wurde • Verwendete die Klickrate von Anzeigen als RL-Belohnungssignal, um den Anzeigentext zu optimieren • Das RL-Modell übertraf die überwachte Basislinie bei der Anzeigenleistung mit einer +6,7 % CTR Metrikgesteuertes Nachtraining in diesem Umfang eröffnet Türen für breitere Anwendungen. Ich bin gespannt, wohin das als Nächstes führt.
3,84K