Los modelos de jueces verificados formalmente pueden liquidar mercados o servir como fuente de verdad en otros contextos. Esto tiene profundas implicaciones --> 1. Tómese el tiempo para crear un modelo de juez debidamente examinado (preferiblemente de código abierto) para el caso de uso. 2. Diseñe un mensaje apropiado, un conjunto de herramientas + fuentes a las que pueda llamar y condiciones para "desencadenar el juicio". 3. Asegúrese de que todo se vea bien para todas las partes involucradas (o para un mecanismo de auditoría que aprueben) 3. Codifique todo en un contrato inteligente e implemente. Después esperas el "disparador" y, si todo se acordó de forma abierta y transparente, el resultado es difícil de discutir.
gensyn
gensyn27 ago, 23:13
1/ Presentamos Judge: el sistema de evaluación de IA verificable de Gensyn. Los evaluadores tradicionales se basan en API cerradas: opacas, actualizadas silenciosamente e imposibles de reproducir. El juez ejecuta un modelo de IA determinista preacordado contra las entradas del mundo real y se compromete a ser desafiado en público.
2.79K