Idag släpper vi ATLAS Reward System, vår nya arkitektur som sätter en ny SOTA på RewardBench V2 med 93,7 % noggrannhet. Vår grundidé var att behandla belöningsgenerering som ett system- och routingproblem. Tråd 👇 Fullständig teknisk blogg: