Aujourd'hui, nous lançons le système de récompense ATLAS, notre nouvelle architecture qui établit un nouveau SOTA sur RewardBench V2 avec une précision de 93,7 %. Notre idée principale était de traiter la génération de récompenses comme un problème de systèmes et de routage. Fil 👇 Blog technique complet :