本日、RewardBench V2 に 93.7% の精度で新しい SOTA を設定する新しいアーキテクチャである ATLAS Reward System をリリースします。 私たちの中心的なアイデアは、報酬の生成をシステムとルーティングの問題として扱うことでした。 糸 👇 技術ブログ全文: