Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Це може бути найбільшим стрибком у кількості агентів штучного інтелекту з часів ReAct.
Дослідники щойно випустили DeepAgent – модель міркування, яка може думати, знаходити інструменти та діяти повністю самостійно.
Жодних заздалегідь прописаних робочих процесів. Немає фіксованих списків інструментів. Просто чисте автономне міркування.
Він вводить щось дике під назвою Memory Folding: агент буквально «стискає» свої минулі думки в структуровані епізодичні, робочі та інструментальні спогади... Як цифровий мозок, який робить вдих, перш ніж знову думати.
Вони також створили новий метод RL під назвою ToolPO, який винагороджує агента не тільки за виконання завдань, але і за те, як він використовував інструменти на цьому шляху.
Які результати? DeepAgent перевершує агентів рівня GPT-4 майже в кожному еталонному WebShop, ALFWorld, GAIA навіть з відкритими інструментами, яких він ніколи не бачив.
Це перший реальний крок до агентів загального мислення, які можуть діяти як люди, запам'ятовуючи, адаптуючись і вчачись думати.
Агентська епоха просто вирівнялася.

Найкращі
Рейтинг
Вибране

