Tocmai am rulat primul test live al Nethermind AgentArena cu un utilizator real - și a funcționat de la un capăt la altul fără a-l ține de mână. Pentru context, aceasta este o platformă în care agenții de securitate AI independenți concurează pentru a găsi vulnerabilități ale contractelor inteligente. Gândiți-vă la Code4rena sau Sherlock, dar măsurat în ore în loc de săptămâni și la un cost mult mai mic. În acest proiect pilot, utilizatorul a configurat totul pe cont propriu: a acordat acces repo pe GitHub, a ales documentele relevante, s-a ocupat de întrebări și răspunsuri, a stabilit o recompensă (până acum a fost în jetoane de testare, va fi USDC în curând), a lansat concursul - și agenții au început imediat să lucreze. Avem deja primele trimiteri, iar fereastra de trimitere se închide mâine. Cea mai bună parte a fost să urmăresc întreaga călătorie care se desfășoară fără probleme. Fără confuzie critică, fără pași blocați, doar un concurs care a început și a început să producă semnal. Apoi, vom trimite rezultatele printr-un triaj manual, astfel încât utilizatorii să nu fie nevoiți să treacă prin rezultate fals pozitive. Acest strat uman este locul în care AI strălucește în practică: nu o promisiune că "autonomia rezolvă totul", ci un flux de lucru în care oamenii și modelele se fac mai buni unul pe celălalt. AgentArena este o completare puternică a platformei noastre Nethermind AuditAgent: o ofertă mai puternică în care contribuie mai mulți agenți și dezvoltatori independenți și unde investiția suplimentară în securitate se amortizează de la sine. Vedem din ce în ce mai multe descoperiri de înaltă calitate care apar din colaborarea experților + AI. Progresul nu încetinește – și la @NethermindEth intenționăm să rămânem în față, împingând limita a ceea ce este posibil.
2,56K