«Майбутній момент GPT-3 для RL» Цікава публікація від @MechanizeWork про перехід до масових тренувань у тисячах різноманітних середовищ. «Подібним чином ми підозрюємо, що момент GPT-3 для RL буде забезпечений значною мірою парадигмою, яку ми називаємо навчанням реплікації. Ця запропонована парадигма передбачає завдання ШІ дублювати існуючі програмні продукти або конкретні функції в них. Прості інструменти командного рядка, які реалізують незрозумілі алгоритми хешування та шифрування, є простими початковими цілями, але цей підхід може легко поширитися на більш складне програмне забезпечення, таке як веб-сайти, професійне програмне забезпечення та ігри».
Посилання:
550