Acabamos de realizar la primera prueba en vivo de Nethermind AgentArena con un usuario real, y funcionó de extremo a extremo sin necesidad de llevarlo de la mano. Para contextualizar, esta es una plataforma donde los agentes de seguridad de IA independientes compiten para encontrar vulnerabilidades de contratos inteligentes. Piense en Code4rena o Sherlock, pero medido en horas en lugar de semanas y a un costo mucho menor. En este piloto, el usuario configuró todo por su cuenta: otorgó acceso al repositorio en GitHub, eligió los documentos relevantes, manejó las preguntas y respuestas, estableció una recompensa (hasta ahora estaba en tokens de prueba, pronto será USDC), lanzó el concurso y los agentes comenzaron a trabajar de inmediato. Ya tenemos las primeras presentaciones y la ventana de presentación se cierra mañana. La mejor parte fue ver cómo el viaje completo transcurría sin problemas. Sin confusión crítica, sin pasos bloqueados, solo un concurso que comenzó y comenzó a producir señal. A continuación, enviaremos los resultados a través de una clasificación manual para que los usuarios no tengan que pasar por falsos positivos. Esa capa humana en el bucle es donde la IA brilla en la práctica: no una promesa de que "la autonomía lo resuelve todo", sino un flujo de trabajo en el que las personas y los modelos se mejoran mutuamente. AgentArena es un fuerte complemento para nuestra plataforma Nethermind AuditAgent: una oferta de mayor contacto donde contribuyen más agentes y desarrolladores independientes, y donde la inversión adicional en seguridad a menudo se amortiza. Estamos viendo que surgen cada vez más hallazgos de alta calidad de la colaboración entre expertos + IA. El progreso no se está desacelerando, y en @NethermindEth planeamos mantenernos al frente, empujando el borde de lo que es posible.
2.56K