1/
W Arc obsesjonujemy się pytaniem: Co tak naprawdę oznacza, że system AI staje się lepszy z czasem?
W rezultacie zaczęliśmy badać, jak mogłoby wyglądać dostosowywanie się i uczenie agentów w czasie wnioskowania.
Artykuł wstępny:
Proponujemy zmianę, od retrenowania skoncentrowanego na modelu do uczenia skoncentrowanego na systemie w czasie wnioskowania.
1/5
Chcesz umożliwić swoim agentom uczenie się w czasie rzeczywistym i w sposób ciągły?
Nasz Atlas SDK to łatwe w użyciu narzędzie, które pozwala każdemu agentowi uczyć się na podstawie doświadczeń.
Zobacz wyniki na własne oczy w tej demonstracji oraz dowiedz się, jak zacząć.
Dziś wprowadzamy System Nagród ATLAS, naszą nową architekturę, która ustanawia nowy SOTA na RewardBench V2 z dokładnością 93,7%.
Naszym głównym pomysłem było traktowanie generowania nagród jako problemu systemowego i routingu.
Wątek 👇
Pełny blog techniczny: