Właśnie przeprowadziliśmy pierwszy test na żywo Nethermind AgentArena z prawdziwym użytkownikiem — i zadziałało od początku do końca bez pomocy. Dla kontekstu, to platforma, na której niezależne agenty AI w dziedzinie bezpieczeństwa konkurują w znajdowaniu luk w smart kontraktach. Pomyśl o Code4rena lub Sherlocku, ale mierzonym w godzinach zamiast tygodni i przy znacznie niższych kosztach. W tym pilotażu użytkownik samodzielnie skonfigurował wszystko: przyznał dostęp do repozytoriów na GitHubie, wybrał odpowiednie dokumenty, zajął się pytaniami i odpowiedziami, ustalił nagrodę (jak dotąd była w tokenach testowych, wkrótce będzie USDC), uruchomił konkurs — a agenty natychmiast zaczęły pracować. Już mamy pierwsze zgłoszenia, a okno zgłoszeń zamyka się jutro. Najlepszą częścią było obserwowanie, jak cała podróż przebiega płynnie. Brak krytycznych nieporozumień, brak zablokowanych kroków, po prostu konkurs, który się rozpoczął i zaczął generować sygnały. Następnie prześlemy wyniki przez ręczną triage, aby użytkownicy nie musieli przeszukiwać fałszywych pozytywów. Ta warstwa człowieka w pętli to miejsce, w którym AI błyszczy w praktyce: nie obietnica, że "autonomia rozwiązuje wszystko", ale przepływ pracy, w którym ludzie i modele czynią się nawzajem lepszymi. AgentArena jest silnym uzupełnieniem naszej platformy Nethermind AuditAgent: bardziej zaawansowana oferta, w której więcej niezależnych agentów i deweloperów wnosi wkład, a dodatkowa inwestycja w bezpieczeństwo często się opłaca. Widzimy coraz więcej wysokiej jakości ustaleń wynikających ze współpracy ekspertów i AI. Postęp nie zwalnia tempa — a w @NethermindEth planujemy pozostać na czołowej pozycji, przesuwając granice tego, co możliwe.
2,54K