Los modelos de juez formalmente verificados pueden resolver mercados o servir como una fuente de verdad en otros contextos. Esto tiene profundas implicaciones --> 1. Tómate el tiempo para construir un modelo de juez adecuadamente verificado (preferiblemente de código abierto) para el caso de uso. 2. Diseña un aviso apropiado, un conjunto de herramientas + fuentes a las que pueda recurrir, y condiciones para "activar el juicio". 3. Asegúrate de que todo se vea bien para todas las partes involucradas (o para un mecanismo de auditoría que aprueben) 3. Codifica todo en un contrato inteligente y despliega. Después, esperas el "disparador" y, si todo se acordó de manera abierta/transparente, el resultado es difícil de disputar.
gensyn
gensyn27 ago, 23:13
1/ Presentamos Judge: el sistema de evaluación de IA verificable de Gensyn. Los evaluadores tradicionales dependen de APIs cerradas: opacas, actualizadas en silencio e imposibles de reproducir. Judge ejecuta un modelo de IA determinista previamente acordado contra entradas del mundo real y se compromete a ser desafiado en público.
2,8K