Nethermind AgentArena の最初のライブ テストを実際のユーザーで実行したところ、手をつかむことなくエンドツーエンドで動作しました。ちなみに、これは独立した AI セキュリティ エージェントがスマート コントラクトの脆弱性を見つけるために競い合うプラットフォームです。Code4rena や Sherlock を思い浮かべてくださいが、数週間ではなく数時間で測定され、コストもはるかに低くなります。 このパイロットでは、GitHubでリポジトリへのアクセスを許可し、関連するドキュメントを選択し、Q&Aを処理し、報奨金を設定し(これまではテストトークンでしたが、まもなくUSDCになります)、コンテストを開始すると、エージェントはすぐに作業を開始しました。すでに最初の提出があり、提出期間は明日締め切られます。 一番良かったのは、全行程がスムーズに進むのを見たことです。重大な混乱も、ブロックされたステップもなく、信号を生み出し始めたコンテストだけでした。次に、ユーザーが誤検知をかき混ぜる必要がないように、手動トリアージを通じて結果を送信します。このヒューマン・イン・ザ・ループの層こそが、AIが実際に輝くところであり、「自律性がすべてを解決する」という約束ではなく、人々とモデルがお互いをより良くするワークフローです。 AgentArenaは、Nethermind AuditAgentプラットフォームを強力に補完するものであり、より多くの独立したエージェントや開発者が貢献し、セキュリティへの追加投資が元が取れることが多い、よりハイタッチなサービスです。専門家+AIのコラボレーションから、質の高い結果がますます生まれています。進歩は衰えることはなく、@NethermindEth の時点では、私たちは最前線に立ち続け、可能性の限界を押し広げる予定です。
2.57K