Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Это может быть самый большой скачок в AI-агентах с момента ReAct.
Исследователи только что представили DeepAgent — модель рассуждений, которая может мыслить, открывать инструменты и действовать совершенно самостоятельно.
Без заранее написанных рабочих процессов. Без фиксированных списков инструментов. Только чистое автономное рассуждение.
Она вводит нечто диковинное, называемое Memory Folding: агент буквально «сжимает» свои прошлые мысли в структурированные эпизодические, рабочие и инструментальные воспоминания… как цифровой мозг, делающий вдох перед тем, как снова подумать.
Они также разработали новый метод RL, называемый ToolPO, который вознаграждает агента не только за выполнение задач, но и за то, как он использовал инструменты на протяжении всего процесса.
Результаты? DeepAgent обходит агентов уровня GPT-4 почти по всем показателям WebShop, ALFWorld, GAIA, даже с открытыми инструментами, которые он никогда не видел.
Это первый реальный шаг к общим агентам рассуждений, которые могут действовать как люди, запоминая, адаптируясь и обучаясь, как мыслить.
Эра агентов только что поднялась на новый уровень.

Топ
Рейтинг
Избранное

