"Le moment GPT-3 à venir pour l'apprentissage par renforcement" Article intéressant de @MechanizeWork sur le passage à un entraînement à grande échelle à travers des milliers d'environnements divers. "De même, nous soupçonnons que le moment GPT-3 pour l'apprentissage par renforcement sera largement rendu possible par un paradigme que nous appelons l'entraînement par réplication. Ce paradigme proposé consiste à charger les IA de dupliquer des produits logiciels existants, ou des fonctionnalités spécifiques au sein de ceux-ci. Des outils simples en ligne de commande qui mettent en œuvre des algorithmes de hachage et de cryptage obscurs sont des cibles initiales simples, mais cette approche peut facilement s'étendre à des logiciels plus complexes, tels que des sites web, des logiciels professionnels et des jeux."
Lien:
611