🚨 Это может быть самый большой скачок в AI-агентах с момента ReAct. Исследователи только что представили DeepAgent — модель рассуждений, которая может мыслить, открывать инструменты и действовать совершенно самостоятельно. Без заранее написанных рабочих процессов. Без фиксированных списков инструментов. Только чистое автономное рассуждение. Она вводит нечто диковинное, называемое Memory Folding: агент буквально «сжимает» свои прошлые мысли в структурированные эпизодические, рабочие и инструментальные воспоминания… как цифровой мозг, делающий вдох перед тем, как снова подумать. Они также разработали новый метод RL, называемый ToolPO, который вознаграждает агента не только за выполнение задач, но и за то, как он использовал инструменты на протяжении всего процесса. Результаты? DeepAgent обходит агентов уровня GPT-4 почти по всем показателям WebShop, ALFWorld, GAIA, даже с открытыми инструментами, которые он никогда не видел. Это первый реальный шаг к общим агентам рассуждений, которые могут действовать как люди, запоминая, адаптируясь и обучаясь, как мыслить. Эра агентов только что поднялась на новый уровень.