1/
Hos Arc har vi vært besatt av et spørsmål: Hva betyr det egentlig for et AI-system å bli bedre over tid?
Som et resultat begynte vi å utforske hvordan det kan se ut for agenter å tilpasse seg og lære på inferenstidspunktet.
Forhåndsutskrift av papir:
Vi foreslår et skifte, fra modellsentrisk omskolering til systemsentrisk inferenstidslæring.
1/5
Vil du muliggjøre kontinuerlig læring i sanntid for agentene dine?
Atlas SDK er en drop-in-sele som lar enhver agent lære av erfaring.
Se resultatene selv i denne demonstrasjonen, samt hvordan du kommer i gang
I dag lanserer vi ATLAS Reward System, vår nye arkitektur som setter en ny SOTA på RewardBench V2 med 93,7 % nøyaktighet.
Kjerneideen vår var å behandle belønningsgenerering som et system- og rutingsproblem.
Tråd 👇
Full teknisk blogg: