Ми щойно провели перший живий тест Nethermind AgentArena з реальним користувачем — і він працював наскрізно, не тримаючи руку в руках. Для контексту, це платформа, де незалежні агенти безпеки зі штучним інтелектом змагаються у пошуку вразливостей смарт-контрактів. Подумайте про Code4rena або Шерлока, але вимірюється в годинах, а не тижнях, і за набагато нижчою вартістю. У цьому пілоті користувач налаштував все самостійно: надав доступ до репозиторію на GitHub, вибрав відповідні документи, обробив Q&A, призначив винагороду (поки що вона була в тестових токенах, скоро буде USDC), запустила конкурс — і агенти одразу почали працювати. У нас вже є перші заявки, а завтра закривається вікно подачі заявок. Найкраще було спостерігати за тим, як повна подорож проходила гладко. Ніякої критичної плутанини, ніяких заблокованих кроків, просто змагання, яке почалося і почало виробляти сигнал. Далі ми надішлемо результати через сортування вручну, щоб користувачам не доводилося шукати помилкові спрацьовування. Саме на цьому шарі «людина в циклі» штучний інтелект сяє на практиці: не обіцянка, що «автономія вирішує все», а робочий процес, де люди та моделі роблять один одного кращими. AgentArena є потужним доповненням до нашої платформи Nethermind AuditAgent: пропозиція з високим рівнем дотику, де більше незалежних агентів і розробників роблять свій внесок, і де додаткові інвестиції в безпеку часто окупаються. Ми бачимо, що все більше і більше високоякісних висновків з'являються в результаті співпраці експертів та штучного інтелекту. Прогрес не сповільнюється, і в @NethermindEth ми плануємо залишатися на передовій, розширюючи межі можливого.
2,56K