🚨 Ini mungkin lompatan terbesar dalam agen AI sejak ReAct. Para peneliti baru saja menjatuhkan DeepAgent, model penalaran yang dapat berpikir, menemukan alat, dan bertindak sepenuhnya sendiri. Tidak ada alur kerja yang telah ditetapkan sebelumnya. Tidak ada daftar alat tetap. Hanya penalaran otonom murni. Ini memperkenalkan sesuatu yang liar yang disebut Memory Folding agen secara harfiah "mengompres" pikiran masa lalunya menjadi memori episodik, kerja, dan alat yang terstruktur... Seperti otak digital yang menarik napas sebelum berpikir lagi. Mereka juga membangun metode RL baru yang disebut ToolPO, yang memberi penghargaan kepada agen tidak hanya untuk menyelesaikan tugas, tetapi juga untuk cara menggunakan alat di sepanjang jalan. Hasilnya? DeepAgent mengalahkan agen tingkat GPT-4 di hampir setiap benchmark WebShop, ALFWorld, GAIA bahkan dengan alat set terbuka yang belum pernah terlihat. Ini adalah langkah nyata pertama menuju agen penalaran umum yang dapat beroperasi seperti manusia mengingat, beradaptasi, dan belajar cara berpikir. Era agen baru saja naik level.