Les modèles de juges formellement vérifiés peuvent régler des marchés ou servir de source de vérité dans d'autres contextes. Cela a des implications profondes --> 1. Prenez le temps de construire un modèle de juge approprié et vérifié (de préférence open source) pour le cas d'utilisation. 2. Concevez un prompt approprié, un ensemble d'outils + sources sur lesquels il peut s'appuyer, et des conditions pour "déclencher le jugement". 3. Assurez-vous que tout semble bon pour toutes les parties impliquées (ou pour un mécanisme d'audit qu'elles approuvent) 3. Codifiez tout cela dans un contrat intelligent et déployez-le. Ensuite, vous attendez le "déclencheur" et, si tout a été convenu de manière ouverte/transparente, le résultat est difficile à contester.
gensyn
gensyn27 août, 23:13
1/ Présentation de Judge : le système d'évaluation AI vérifiable de Gensyn. Les évaluateurs traditionnels s'appuient sur des API fermées - opaques, mises à jour silencieusement et impossibles à reproduire. Judge exécute un modèle AI déterministe préalablement convenu sur des entrées du monde réel et s'engage à être mis au défi en public.
2,79K