跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-19.85%
USELESS
-13.89%
IKUN
-6.06%
gib
-14.96%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-10.87%
ALON
-6.72%
LAUNCHCOIN
-18.21%
GOONC
-11.87%
KLED
-10.46%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-17.55%
Boopa
-20.51%
PORK
-13.58%
主页
Robert Youssef
Robert Youssef
16 小时前
🚨 RIP “提示工程”。 GAIR团队刚刚发布了上下文工程2.0——这完全重新定义了我们对人类与AI互动的思考方式。 忘掉提示。忘掉“少量示例”。上下文才是真正的接口。 这里是核心思想: “一个人是他们上下文的总和。” 机器之所以失败,并不是因为它们缺乏智能。 它们失败是因为缺乏上下文处理能力。 上下文工程2.0描绘了这一演变: 1.0 上下文作为翻译 人类适应计算机。 2.0 上下文作为指令 大型语言模型解释自然语言。 3.0 上下文作为场景 代理理解你的目标。 4.0 上下文作为世界 AI主动构建你的环境。 我们正处于2.0 → 3.0的转变之中。 从“上下文感知”到“上下文协作”系统的跃迁改变了一切,从内存设计到多代理协作。 这不是一个流行词。它是AI时代的新基础。 阅读论文:arxiv. org/abs/2510.26493v1
113.2K
1.21K
Robert Youssef
11月1日 18:02
天哪……Meta 可能刚刚解决了自我改进的 AI 🤯 他们的新论文 SPICE(语料环境中的自我游戏)基本上将语言模型变成了自己的老师,没有人类,没有标签,没有数据集,只有互联网作为训练场。 这里有个转折:模型的一个副本成为挑战者,挖掘真实文档以创建困难的、基于事实的推理问题。另一个副本成为推理者,试图在没有访问源的情况下解决这些问题。 它们相互竞争、学习并共同进化,形成一个自动化的课程,具有现实世界的基础,因此它永远不会陷入幻觉。 结果令人震惊: 在推理基准上,Qwen3-4B 提高了 9.1% OctoThinker-8B 提高了 11.9% 并且它击败了所有之前的自我游戏方法,如 R-Zero 和 Absolute Zero。 这颠覆了 AI 自我改进的剧本。 SPICE 通过挖掘真实知识而不是循环合成垃圾来成长——一个封闭循环系统,具有开放世界的智能。 如果这能扩展,我们可能正在盯着自主、自我进化推理模型的蓝图。
162.39K
1.77K
Robert Youssef
2025年10月30日
🚨 这可能是自 ReAct 以来 AI 代理的最大飞跃。 研究人员刚刚发布了 DeepAgent,这是一种推理模型,可以独立思考、发现工具并完全自主行动。 没有预先编写的工作流程。没有固定的工具列表。只有纯粹的自主推理。 它引入了一种叫做记忆折叠的疯狂概念,代理字面上将其过去的思维“压缩”成结构化的情节记忆、工作记忆和工具记忆……就像一个数字大脑在再次思考之前深呼吸。 他们还建立了一种新的强化学习方法,称为 ToolPO,该方法不仅奖励代理完成任务,还奖励它在过程中如何使用工具。 结果呢?DeepAgent 在几乎所有基准测试中都超越了 GPT-4 级别的代理,包括 WebShop、ALFWorld、GAIA,即使使用它从未见过的开放集工具。 这是朝着能够像人类一样操作的通用推理代理迈出的第一步,能够记忆、适应并学习如何思考。 代理时代刚刚升级。
100
10
热门
排行
收藏