1/
Bij Arc zijn we gefascineerd door de vraag: Wat betekent het eigenlijk voor een AI-systeem om in de loop van de tijd beter te worden?
Als gevolg hiervan zijn we begonnen te verkennen hoe het eruit zou zien als agenten zich zouden aanpassen en leren tijdens de inferentietijd.
Pre-Print Paper:
We stellen een verschuiving voor, van modelgerichte hertraining naar systeemgerichte leren tijdens de inferentietijd.
1/5
Wil je real-time, continu leren voor je agenten mogelijk maken?
Onze Atlas SDK is een drop-in harnas dat elke agent laat leren van ervaring.
Bekijk de resultaten zelf in deze demo, evenals hoe je aan de slag kunt.
Vandaag lanceren we het ATLAS Reward System, onze nieuwe architectuur die een nieuwe SOTA instelt op RewardBench V2 met 93,7% nauwkeurigheid.
Ons kernidee was om beloningsgeneratie te beschouwen als een systeem- en routeringsprobleem.
Draad 👇
Volledige technische blog: