"Khoảnh khắc GPT-3 sắp tới cho RL" Bài viết thú vị của @MechanizeWork về sự chuyển mình hướng tới việc đào tạo quy mô lớn trên hàng ngàn môi trường đa dạng. "Tương tự, chúng tôi nghi ngờ rằng khoảnh khắc GPT-3 cho RL sẽ chủ yếu được kích hoạt bởi một mô hình mà chúng tôi gọi là đào tạo sao chép. Mô hình đề xuất này liên quan đến việc giao nhiệm vụ cho các AI sao chép các sản phẩm phần mềm hiện có, hoặc các tính năng cụ thể bên trong chúng. Các công cụ dòng lệnh đơn giản thực hiện các thuật toán băm và mã hóa khó hiểu là những mục tiêu ban đầu đơn giản, nhưng cách tiếp cận này có thể dễ dàng mở rộng đến phần mềm phức tạp hơn, chẳng hạn như trang web, phần mềm chuyên nghiệp và trò chơi."
Liên kết:
585