"El próximo momento GPT-3 para RL" Interesante publicación de @MechanizeWork sobre el cambio hacia el entrenamiento a gran escala en miles de entornos diversos. "De manera similar, sospechamos que el momento GPT-3 para RL será habilitado en gran medida por un paradigma que estamos llamando entrenamiento de replicación. Este paradigma propuesto implica encargar a las IA la duplicación de productos de software existentes, o características específicas dentro de ellos. Herramientas simples de línea de comandos que implementan algoritmos de hashing y cifrado oscuros son objetivos iniciales sencillos, pero este enfoque puede extenderse fácilmente a software más complejo, como sitios web, software profesional y juegos."
Enlace:
548