「RL の今後の GPT-3 の瞬間」 何千もの多様な環境にわたる大規模なトレーニングへの移行に関する@MechanizeWorkによる興味深い投稿。 「同様に、RL の GPT-3 の瞬間は、主にレプリケーション トレーニングと呼ばれるパラダイムによって可能になるのではないかと考えています。この提案されたパラダイムには、既存のソフトウェア製品またはその中の特定の機能を複製する任務を AI に課すことが含まれます。あいまいなハッシュと暗号化のアルゴリズムを実装する単純なコマンドライン ツールは、最初のターゲットとしては簡単ですが、このアプローチは、Web サイト、プロフェッショナル ソフトウェア、ゲームなどのより複雑なソフトウェアにも簡単に拡張できます。」
リンク:
545