SK Telecom + @AdaptiveML entrenaron a Gemma 3 4B con PPO obteniendo resultados impresionantes, especialmente para un modelo de tal tamaño Aprende más sobre cómo lo hicieron
3,01K