🚨 これは、ReAct 以来の AI エージェントにおける最大の飛躍かもしれません。 研究者らは、完全に独自に考え、ツールを発見し、行動できる推論モデルである DeepAgent をドロップしたばかりです。 事前にスクリプト化されたワークフローはありません。固定ツールリストはありません。純粋な自律的な推論にすぎません。 それは記憶フォールディングと呼ばれるワイルドなものを導入しますエージェントは、文字通り過去の思考を構造化されたエピソード、作業、およびツールの記憶に「圧縮」します...デジタルの脳が息を吸ってからもう一度考えるようなものです。 また、ToolPO と呼ばれる新しい RL メソッドも構築し、エージェントがタスクを完了しただけでなく、途中でツールをどのように使用したかに対して報酬を与えました。 結果は?DeepAgentは、WebShop、ALFWorld、GAIAのほぼすべてのベンチマークで、これまでに見たことのないオープンセットツールを使用しても、GPT-4レベルのエージェントを上回っています。 これは、人間が記憶し、適応し、考え方を学ぶように動作できる一般的な推論エージェントへの最初の本当のステップです。 エージェント時代がレベルアップしたばかりだ。