"Der bevorstehende GPT-3-Moment für RL" Interessanter Beitrag von @MechanizeWork über den Übergang zu massivem Training in Tausenden von unterschiedlichen Umgebungen. "Ähnlich vermuten wir, dass der GPT-3-Moment für RL größtenteils durch ein Paradigma ermöglicht wird, das wir Replikationstraining nennen. Dieses vorgeschlagene Paradigma beinhaltet, KI damit zu beauftragen, bestehende Softwareprodukte oder spezifische Funktionen innerhalb dieser zu duplizieren. Einfache Kommandozeilenwerkzeuge, die obskure Hash- und Verschlüsselungsalgorithmen implementieren, sind einfache erste Ziele, aber dieser Ansatz kann leicht auf komplexere Software ausgeweitet werden, wie Websites, professionelle Software und Spiele."
Verbinden:
518