Acabamos de realizar la primera prueba en vivo de Nethermind AgentArena con un usuario real, y funcionó de extremo a extremo sin necesidad de asistencia. Para dar contexto, esta es una plataforma donde agentes de seguridad AI independientes compiten para encontrar vulnerabilidades en contratos inteligentes. Piensa en Code4rena o Sherlock, pero medido en horas en lugar de semanas y a un costo mucho más bajo. En este piloto, el usuario configuró todo por su cuenta: otorgó acceso al repositorio en GitHub, eligió la documentación relevante, manejó las preguntas y respuestas, estableció una recompensa (hasta ahora ha sido en tokens de prueba, pronto será USDC), lanzó el concurso, y los agentes comenzaron a trabajar de inmediato. Ya tenemos las primeras presentaciones, y la ventana de presentación cierra mañana. La mejor parte fue ver que todo el proceso se desarrolló sin problemas. Sin confusiones críticas, sin pasos bloqueados, solo un concurso que comenzó y empezó a producir señales. A continuación, enviaremos los resultados a través de un triaje manual para que los usuarios no tengan que lidiar con falsos positivos. Esa capa de humano en el proceso es donde la AI brilla en la práctica: no es una promesa de que "la autonomía lo resuelve todo", sino un flujo de trabajo donde las personas y los modelos se mejoran mutuamente. AgentArena es un fuerte complemento a nuestra plataforma Nethermind AuditAgent: una oferta más personalizada donde más agentes independientes y desarrolladores contribuyen, y donde la inversión adicional en seguridad a menudo se paga por sí misma. Estamos viendo emerger cada vez más hallazgos de alta calidad de la colaboración entre expertos y AI. El progreso no se está desacelerando, y en @NethermindEth planeamos mantenernos a la vanguardia, empujando los límites de lo que es posible.
2,56K