"Nadcházející okamžik GPT-3 pro RL" Zajímavý příspěvek od @MechanizeWork o posunu směrem k masivnímu školení v tisících různých prostředí. "Podobně se domníváme, že okamžik GPT-3 pro RL bude z velké části umožněn paradigmatem, které nazýváme replikační trénink. Toto navrhované paradigma zahrnuje pověření umělé inteligence duplikací stávajících softwarových produktů nebo specifických funkcí v nich. Jednoduché nástroje příkazového řádku, které implementují obskurní hashovací a šifrovací algoritmy, jsou přímočarými počátečními cíli, ale tento přístup lze snadno rozšířit na složitější software, jako jsou webové stránky, profesionální software a hry."
Propojit:
502