跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-5.57%
USELESS
+5.26%
IKUN
-8.39%
gib
-7.81%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.73%
ALON
-7.39%
LAUNCHCOIN
+12.95%
GOONC
-2.85%
KLED
-7.44%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.25%
Boopa
+14.66%
PORK
-3.33%
主页
Connor Davis
Connor Davis
21 小时前
这篇麻省理工学院的论文让我大开眼界 🤯 这篇论文讨论了“ARC”,它完全改变了我对基准的看法。 研究人员根本没有把ARC当作逻辑难题。他们把每个任务都视为视觉变换。 网格输入 → 网格输出。没有比这更复杂的了。 他们构建了一个小型视觉变换器,从头开始在ARC的小数据集上进行训练,并使用一个简单的画布技巧将每个示例放置得像一幅图像。 然后他们添加了尺度变化、平移和经典计算机视觉工作中会看到的基本视觉先验。 就这样。 没有链式思维,没有提示,没有巧妙的符号技巧。 只是一个模型在观察像素,学习形状如何移动、翻转、增长、收缩或延续。 最疯狂的部分? 这个小模型单独达到54.5%的准确率,与U-Net结合时达到60.4%。 这大约是普通人类表现的平均水平,而这个模型的大小仅相当于一个小型移动应用。 以这种方式看到ARC的解决方案让整个基准感觉不同。 这些任务突然看起来像是图像映射,而不是隐藏规则。反射任务实际上看起来像反射。 对称任务看起来像对称。重力任务看起来像是“直线下落”到画布上的碎片。 我老实说还在消化这一切。 这可能是我多年读到的最扎实的ARC结果,它来自于对基准的最字面理解。
3.26K
28
Connor Davis
11月26日 21:08
Anthropic刚刚在他们测试过的每位人类工程师中得分最高。 Claude Opus 4.5于昨天发布,超越了GPT-5.1-Codex-Max、Gemini 3 Pro以及他们内部编码考试中的每一位人类候选人。 这是没人谈论的事情:
3.15K
32
Connor Davis
11月25日 19:52
最强大的 AI 代理构建工具 👇 1. n8n 2. LangChain 3. CrewAI 4. OpenAI 的代理构建器 你现在在使用哪个? 我在真实项目中尝试过它们所有的工具,n8n 一直是桌上最强大的工具。它处理实际工作。混乱的工作。触及实际系统的工作,而不是停留在聊天泡沫中。 这就是让我坚持使用它的原因: n8n 让我构建可以打开电子邮件、阅读它们、提取有用数据并将其发送到需要去的地方的代理。它让我将这些代理连接到 CRM、电子表格、数据库、Slack、Notion、API,以及我的工作流程所依赖的任何其他工具。 我可以堆叠步骤,构建循环,重试任务,并全程可见地观察一切运行。 LangChain 给了我灵活性,但工作流程很快就变得复杂。 CrewAI 让早期实验变得简单,但复杂的过程超出了它的能力。 OpenAI 的代理构建器有潜力,但当你需要更深层次的控制时,问题很快就会出现。 n8n 处理了从推理到行动的完整管道,而不需要我构建后端或手动将工具粘合在一起。它让代理感觉像一个真正的操作员,而不是一个多步骤的聊天机器人。 真正的转变发生在我看到如何干净地将单一工作流程转变为可重复的东西时。不是演示,而是一个可工作的系统。一个企业每天都可以依赖的东西。 如果你今年在构建代理,你选择的平台将决定一切。 所以我很好奇你在使用哪个,以及是什么让你选择它。
4.24K
34
热门
排行
收藏