"Det kommende GPT-3-øyeblikket for RL" Interessant innlegg av @MechanizeWork om skiftet mot massiv trening på tvers av tusenvis av forskjellige miljøer. «På samme måte mistenker vi at GPT-3-øyeblikket for RL i stor grad vil bli muliggjort av et paradigme vi kaller replikasjonstrening. Dette foreslåtte paradigmet innebærer å gi AI-er i oppgave å duplisere eksisterende programvareprodukter, eller spesifikke funksjoner i dem. Enkle kommandolinjeverktøy som implementerer obskure hashing- og krypteringsalgoritmer er enkle innledende mål, men denne tilnærmingen kan enkelt utvides til mer kompleks programvare, for eksempel nettsteder, profesjonell programvare og spill."
Lenke:
512