Modelos de juízes formalmente verificados podem liquidar mercados ou servir como fonte de verdade em outros contextos. Isso tem implicações profundas --> 1. Reserve um tempo para criar um modelo de juiz devidamente examinado (de preferência de código aberto) para o caso de uso. 2. Projete um prompt apropriado, um conjunto de ferramentas + fontes que ele pode invocar e as condições para "desencadear o julgamento". 3. Certifique-se de que tudo esteja bem para todas as partes envolvidas (ou para um mecanismo de auditoria que eles aprovem) 3. Codifique tudo em um contrato inteligente e implante. Depois você espera pelo "gatilho" e, se tudo foi acordado de forma aberta / transparente, o resultado é difícil de contestar.
gensyn
gensyn27 de ago., 23:13
1/ Apresentando o sistema de avaliação de IA verificável de Judge: Gensyn. Os avaliadores tradicionais contam com APIs fechadas - opacas, atualizadas silenciosamente e impossíveis de reproduzir. O juiz executa um modelo de IA determinístico pré-acordado contra entradas do mundo real e se compromete a ser desafiado em público.
2,79K