一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

发现功能使用指南

discoveryBanners

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN-18.21%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

Robert Youssef

Robert Youssef

Robert Youssef16 小时前

🚨 RIP “提示工程”。 GAIR团队刚刚发布了上下文工程2.0——这完全重新定义了我们对人类与AI互动的思考方式。忘掉提示。忘掉“少量示例”。上下文才是真正的接口。这里是核心思想： “一个人是他们上下文的总和。” 机器之所以失败，并不是因为它们缺乏智能。它们失败是因为缺乏上下文处理能力。上下文工程2.0描绘了这一演变： 1.0 上下文作为翻译人类适应计算机。 2.0 上下文作为指令大型语言模型解释自然语言。 3.0 上下文作为场景代理理解你的目标。 4.0 上下文作为世界 AI主动构建你的环境。我们正处于2.0 → 3.0的转变之中。从“上下文感知”到“上下文协作”系统的跃迁改变了一切，从内存设计到多代理协作。这不是一个流行词。它是AI时代的新基础。阅读论文：arxiv. org/abs/2510.26493v1

113.2K

Robert Youssef

Robert Youssef11月1日 18:02

天哪……Meta 可能刚刚解决了自我改进的 AI 🤯 他们的新论文 SPICE（语料环境中的自我游戏）基本上将语言模型变成了自己的老师，没有人类，没有标签，没有数据集，只有互联网作为训练场。这里有个转折：模型的一个副本成为挑战者，挖掘真实文档以创建困难的、基于事实的推理问题。另一个副本成为推理者，试图在没有访问源的情况下解决这些问题。它们相互竞争、学习并共同进化，形成一个自动化的课程，具有现实世界的基础，因此它永远不会陷入幻觉。结果令人震惊：在推理基准上，Qwen3-4B 提高了 9.1% OctoThinker-8B 提高了 11.9% 并且它击败了所有之前的自我游戏方法，如 R-Zero 和 Absolute Zero。这颠覆了 AI 自我改进的剧本。 SPICE 通过挖掘真实知识而不是循环合成垃圾来成长——一个封闭循环系统，具有开放世界的智能。如果这能扩展，我们可能正在盯着自主、自我进化推理模型的蓝图。

162.39K

Robert Youssef

Robert Youssef2025年10月30日

🚨 这可能是自 ReAct 以来 AI 代理的最大飞跃。研究人员刚刚发布了 DeepAgent，这是一种推理模型，可以独立思考、发现工具并完全自主行动。没有预先编写的工作流程。没有固定的工具列表。只有纯粹的自主推理。它引入了一种叫做记忆折叠的疯狂概念，代理字面上将其过去的思维“压缩”成结构化的情节记忆、工作记忆和工具记忆……就像一个数字大脑在再次思考之前深呼吸。他们还建立了一种新的强化学习方法，称为 ToolPO，该方法不仅奖励代理完成任务，还奖励它在过程中如何使用工具。结果呢？DeepAgent 在几乎所有基准测试中都超越了 GPT-4 级别的代理，包括 WebShop、ALFWorld、GAIA，即使使用它从未见过的开放集工具。这是朝着能够像人类一样操作的通用推理代理迈出的第一步，能够记忆、适应并学习如何思考。代理时代刚刚升级。

100

热门

排行

收藏

©2017 - 2025 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包