1/
På Arc har vi varit besatta av en fråga: Vad innebär det egentligen för ett AI-system att bli bättre med tiden?
Som ett resultat började vi utforska hur det kan se ut för agenter att anpassa sig och lära sig vid inferenstiden.
Papper före tryck:
Vi föreslår ett skifte, från modellcentrerad omskolning till systemcentrerad inferenstidsinlärning.
1/5
Vill du möjliggöra kontinuerlig inlärning i realtid för dina agenter?
Vår Atlas SDK är en drop-in-sele som gör att alla agenter kan lära sig av erfarenheten.
Se resultaten själv i den här demon, samt hur du kommer igång
Idag släpper vi ATLAS Reward System, vår nya arkitektur som sätter en ny SOTA på RewardBench V2 med 93,7 % noggrannhet.
Vår grundidé var att behandla belöningsgenerering som ett system- och routingproblem.
Tråd 👇
Fullständig teknisk blogg: