分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

🚨 これは、ReAct 以来の AI エージェントにおける最大の飛躍かもしれません。研究者らは、完全に独自に考え、ツールを発見し、行動できる推論モデルである DeepAgent をドロップしたばかりです。事前にスクリプト化されたワークフローはありません。固定ツールリストはありません。純粋な自律的な推論にすぎません。それは記憶フォールディングと呼ばれるワイルドなものを導入しますエージェントは、文字通り過去の思考を構造化されたエピソード、作業、およびツールの記憶に「圧縮」します...デジタルの脳が息を吸ってからもう一度考えるようなものです。また、ToolPO と呼ばれる新しい RL メソッドも構築し、エージェントがタスクを完了しただけでなく、途中でツールをどのように使用したかに対して報酬を与えました。結果は?DeepAgentは、WebShop、ALFWorld、GAIAのほぼすべてのベンチマークで、これまでに見たことのないオープンセットツールを使用しても、GPT-4レベルのエージェントを上回っています。これは、人間が記憶し、適応し、考え方を学ぶように動作できる一般的な推論エージェントへの最初の本当のステップです。エージェント時代がレベルアップしたばかりだ。

トップ

ランキング

お気に入り