Сьогодні ми випускаємо ATLAS Reward System, нашу нову архітектуру, яка встановлює нову SOTA на RewardBench V2 з точністю 93,7%. Наша основна ідея полягала в тому, щоб розглядати генерацію винагород як проблему систем і маршрутизації. Нитка 👇 Повний технічний блог: