"O Próximo Momento GPT-3 para RL" Post interessante de @MechanizeWork sobre a mudança para o treinamento em larga escala em milhares de ambientes diversos. "De forma semelhante, suspeitamos que o momento GPT-3 para RL será possibilitado em grande parte por um paradigma que estamos chamando de treinamento de replicação. Este paradigma proposto envolve atribuir às IAs a tarefa de duplicar produtos de software existentes ou características específicas dentro deles. Ferramentas simples de linha de comando que implementam algoritmos de hashing e criptografia obscuros são alvos iniciais diretos, mas essa abordagem pode facilmente se estender a softwares mais complexos, como websites, softwares profissionais e jogos."
Hiperligação:
596