SK Telecom + @AdaptiveML обучили Gemma 3 4B с помощью PPO, получив впечатляющие результаты, особенно для модели такого размера. Узнайте больше о том, как они это сделали.
3,02K