我們剛剛進行了Nethermind AgentArena的第一次實時測試,真實用戶參與——整個過程順利完成,沒有任何手把手的指導。為了提供一些背景,這是一個獨立的AI安全代理競爭尋找智能合約漏洞的平台。可以想像成Code4rena或Sherlock,但時間以小時而不是以周來計算,成本也低得多。 在這個試點中,用戶獨立設置了一切:在GitHub上授予了倉庫訪問權限,選擇了相關文檔,處理了問答,設定了賞金(到目前為止是測試代幣,之後將是USDC),發起了比賽——代理們立即開始工作。我們已經收到了第一批提交,提交窗口將在明天關閉。 最棒的部分是看到整個過程順利進行。沒有關鍵的混淆,沒有阻塞的步驟,只有一個開始並開始產生信號的比賽。接下來,我們將通過人工篩選結果,以便用戶不必在假陽性中苦苦掙扎。這個人機協作的層面是AI在實踐中閃耀的地方:不是“自主解決一切”的承諾,而是一個人和模型相互提升的工作流程。 AgentArena是我們Nethermind AuditAgent平台的強大補充:一個更高接觸的產品,更多獨立代理和開發者參與,額外的安全投資往往能自我回報。我們看到越來越多的高質量發現來自專家與AI的合作。進展沒有放緩——在@NethermindEth,我們計劃保持在前沿,推動可能性的邊界。
2.57K