Modelos de juízes formalmente verificados podem resolver mercados ou servir como uma fonte de verdade em outros contextos. Isto tem profundas implicações --> 1. Reserve tempo para construir um modelo de juiz devidamente verificado (preferencialmente de código aberto) para o caso de uso. 2. Desenhe um prompt apropriado, um conjunto de ferramentas+fontes que ele pode chamar, e condições para "ativar o julgamento". 3. Certifique-se de que tudo parece bom para todas as partes envolvidas (ou para um mecanismo de auditoria que elas aprovem) 3. Codifique tudo isso em um contrato inteligente e implemente. Depois, você espera pelo "gatilho" e, se tudo foi acordado de forma aberta/transparente, o resultado é difícil de contestar.
gensyn
gensyn27/08, 23:13
1/ Apresentando o Judge: o sistema de avaliação de IA verificável da Gensyn. Os avaliadores tradicionais dependem de APIs fechadas - opacas, atualizadas silenciosamente e impossíveis de reproduzir. O Judge executa um modelo de IA determinístico, previamente acordado, contra entradas do mundo real e compromete-se a ser desafiado em público.
2,78K