"لحظة GPT-3 القادمة ل RL" منشور مثير للاهتمام من @MechanizeWork حول التحول نحو التدريب على نطاق واسع عبر آلاف البيئات المتنوعة. "وبالمثل ، نشك في أن لحظة GPT-3 ل RL سيتم تمكينها إلى حد كبير من خلال نموذج نسميه تدريب النسخ المتماثل. يتضمن هذا النموذج المقترح تكليف الذكاء الاصطناعي بتكرار منتجات البرامج الحالية أو ميزات محددة داخلها. تعد أدوات سطر الأوامر البسيطة التي تنفذ خوارزميات التجزئة والتشفير الغامضة أهدافا أولية مباشرة ، ولكن هذا النهج يمكن أن يمتد بسهولة إلى برامج أكثر تعقيدا ، مثل مواقع الويب والبرامج الاحترافية والألعاب.
رابط:
‏‎566‏