"Il prossimo momento GPT-3 per RL" Post interessante di @MechanizeWork sul passaggio verso un addestramento su larga scala attraverso migliaia di ambienti diversi. "Allo stesso modo, sospettiamo che il momento GPT-3 per RL sarà abilitato in gran parte da un paradigma che chiamiamo addestramento per replicazione. Questo paradigma proposto prevede di incaricare le IA di duplicare prodotti software esistenti, o specifiche funzionalità al loro interno. Strumenti da riga di comando semplici che implementano algoritmi di hashing e crittografia oscuri sono obiettivi iniziali semplici, ma questo approccio può facilmente estendersi a software più complessi, come siti web, software professionale e giochi."
Collegamento:
540