Vi har precis kört det första livetestet av Nethermind AgentArena med en riktig användare – och det fungerade från början till slut utan att hålla varandra i handen. För sammanhanget är detta en plattform där oberoende AI-säkerhetsagenter tävlar om att hitta sårbarheter i smarta kontrakt. Tänk Code4rena eller Sherlock, men mätt i timmar istället för veckor och till en mycket lägre kostnad. I den här piloten konfigurerade användaren allt på egen hand: beviljade repo-åtkomst på GitHub, valde relevanta dokument, hanterade frågor och svar, satte en belöning (hittills var det i testtokens, kommer snart att vara USDC), startade tävlingen – och agenterna började omedelbart arbeta. Vi har redan fått in de första inlämningarna och inlämningsfönstret stänger i morgon. Det bästa var att se hela resan gå smidigt. Ingen kritisk förvirring, inga blockerade steg, bara en tävling som startade och började producera signal. Därefter skickar vi resultaten via en manuell sortering så att användarna inte behöver vada genom falska positiva identifieringar. Det är i det mänskliga loop-lagret som AI briljerar i praktiken: inte ett löfte om att "autonomi löser allt", utan ett arbetsflöde där människor och modeller gör varandra bättre. AgentArena är ett starkt komplement till vår Nethermind AuditAgent-plattform: ett erbjudande där fler oberoende agenter och utvecklare bidrar, och där den extra investeringen i säkerhet ofta betalar sig själv. Vi ser fler och fler högkvalitativa resultat dyka upp från samarbete mellan experter och AI. Framstegen saktar inte ner – och vid @NethermindEth planerar vi att ligga i framkant och tänja på gränserna för vad som är möjligt.
2,61K