"Momen GPT-3 Mendatang untuk RL" Posting menarik oleh @MechanizeWork tentang pergeseran menuju pelatihan skala besar di ribuan lingkungan yang beragam. "Demikian pula, kami menduga momen GPT-3 untuk RL akan diaktifkan sebagian besar oleh paradigma yang kami sebut pelatihan replikasi. Paradigma yang diusulkan ini melibatkan penugasan AI untuk menduplikasi produk perangkat lunak yang ada, atau fitur khusus di dalamnya. Alat baris perintah sederhana yang mengimplementasikan algoritme hashing dan enkripsi yang tidak jelas adalah target awal yang mudah, tetapi pendekatan ini dapat dengan mudah meluas ke perangkat lunak yang lebih kompleks, seperti situs web, perangkat lunak profesional, dan game."
Tautan:
543