A SK Telecom + @AdaptiveML treinaram a Gemma 3 4B com PPO, obtendo resultados impressionantes, especialmente para um modelo de tal tamanho. Saiba mais sobre como eles fizeram isso.
3K