1/
Di Arc, kami terobsesi dengan sebuah pertanyaan: Apa artinya sebenarnya bagi sistem AI untuk menjadi lebih baik dari waktu ke waktu?
Akibatnya, kami mulai mengeksplorasi seperti apa agen untuk beradaptasi dan belajar pada waktu inferensi.
Kertas Pra-Cetak:
Kami mengusulkan pergeseran, dari pelatihan ulang yang berpusat pada model ke pembelajaran waktu inferensi yang berpusat pada sistem.
1/5
Ingin mengaktifkan pembelajaran berkelanjutan secara real-time untuk agen Anda?
Atlas SDK kami adalah harness drop-in yang memungkinkan agen mana pun belajar dari pengalaman.
Lihat sendiri hasilnya di demo ini, serta cara memulai
Hari ini, kami merilis ATLAS Reward System, arsitektur baru kami yang menetapkan SOTA baru di RewardBench V2 dengan akurasi 93,7%.
Ide inti kami adalah memperlakukan perolehan hadiah sebagai masalah sistem dan perutean.
Benang 👇
Blog Teknis Lengkap: