"Nadchodzący moment GPT-3 dla RL" Interesujący post autorstwa @MechanizeWork na temat przejścia w kierunku masowego szkolenia w tysiącach różnorodnych środowisk. "Podobnie podejrzewamy, że moment GPT-3 dla RL będzie w dużej mierze możliwy dzięki paradygmatowi, który nazywamy szkoleniem replikacyjnym. Proponowany paradygmat polega na zlecaniu AI duplikowania istniejących produktów oprogramowania lub konkretnych funkcji w ich ramach. Proste narzędzia wiersza poleceń, które implementują niejasne algorytmy haszowania i szyfrowania, są prostymi początkowymi celami, ale to podejście można łatwo rozszerzyć na bardziej złożone oprogramowanie, takie jak strony internetowe, oprogramowanie profesjonalne i gry."
Łącze:
597