1/ Presentamos Judge: el sistema de evaluación de IA verificable de Gensyn. Los evaluadores tradicionales dependen de APIs cerradas: opacas, actualizadas en silencio e imposibles de reproducir. Judge ejecuta un modelo de IA determinista previamente acordado contra entradas del mundo real y se compromete a ser desafiado en público.
38,76K