Modelele de judecători verificate formal pot stabili piețele sau pot servi drept sursă de adevăr în alte contexte. Acest lucru are implicații profunde --> 1. Fă-ți timp pentru a construi un model de judecător verificat corespunzător (de preferință open source) pentru cazul de utilizare. 2. Proiectați un prompt adecvat, un set de instrumente + surse pe care le poate apela și condiții pentru a "declanșa judecata". 3. Asigurați-vă că totul arată bine pentru toate părțile implicate (sau pentru un mecanism de audit pe care îl aprobă) 3. Codificați totul într-un contract inteligent și implementați-l. După aceea aștepți "declanșatorul" și, dacă totul a fost convenit deschis/transparent, rezultatul este greu de contestat.
gensyn
gensyn27 aug., 23:13
1/ Vă prezentăm Judge: Sistemul verificabil de evaluare AI al Gensyn. Evaluatorii tradiționali se bazează pe API-uri închise - opace, actualizate în tăcere și imposibil de reprodus. Judge execută un model AI determinist prestabilit împotriva intrărilor din lumea reală și se angajează să fie contestat în public.
2,79K