トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 これは、ReAct 以来の AI エージェントにおける最大の飛躍かもしれません。
研究者らは、完全に独自に考え、ツールを発見し、行動できる推論モデルである DeepAgent をドロップしたばかりです。
事前にスクリプト化されたワークフローはありません。固定ツールリストはありません。純粋な自律的な推論にすぎません。
それは記憶フォールディングと呼ばれるワイルドなものを導入しますエージェントは、文字通り過去の思考を構造化されたエピソード、作業、およびツールの記憶に「圧縮」します...デジタルの脳が息を吸ってからもう一度考えるようなものです。
また、ToolPO と呼ばれる新しい RL メソッドも構築し、エージェントがタスクを完了しただけでなく、途中でツールをどのように使用したかに対して報酬を与えました。
結果は?DeepAgentは、WebShop、ALFWorld、GAIAのほぼすべてのベンチマークで、これまでに見たことのないオープンセットツールを使用しても、GPT-4レベルのエージェントを上回っています。
これは、人間が記憶し、適応し、考え方を学ぶように動作できる一般的な推論エージェントへの最初の本当のステップです。
エージェント時代がレベルアップしたばかりだ。

トップ
ランキング
お気に入り

