跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+1.21%
USELESS
+11.15%
IKUN
-2.48%
gib
+0.9%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.64%
ALON
-0.93%
LAUNCHCOIN
-5.68%
GOONC
-1.92%
KLED
-4.28%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.8%
Boopa
+15.8%
PORK
0.00%
主頁
Connor Davis
Connor Davis
11月27日 19:43
這篇MIT論文真是讓我大開眼界 🤯 這篇論文是關於「ARC」,它徹底改變了我對基準的看法。 研究人員根本沒有把ARC當作邏輯謎題來處理。他們把每個任務都視為視覺轉換。 網格進 → 網格出。沒有比這更複雜的了。 他們建立了一個小型的視覺變壓器,從頭開始在ARC的小數據集上進行訓練,並使用一個簡單的畫布技巧將每個例子放置得像一幅圖像。 然後他們添加了比例變化、平移和你在經典計算機視覺工作中會看到的基本視覺先驗。 就這樣。 沒有思考鏈,沒有提示,沒有巧妙的符號技巧。 只有一個模型在觀察像素,學習形狀如何移動、翻轉、增長、崩潰或延續。 最瘋狂的部分? 這個小模型單獨達到54.5%,與U-Net結合時達到60.4%。 這大約是平均人類表現,而這個模型的大小僅相當於一個小型移動應用。 以這種方式看到ARC的解決方案讓整個基準感覺不同。 這些任務突然看起來像是圖像映射,而不是隱藏的規則。反射任務實際上看起來像反射。 對稱任務看起來像對稱。重力任務看起來像是「掉落」到畫布上的碎片。 我老實說還在消化這一切。 這可能是我多年來讀到的最具實質性的ARC結果,因為它是以最字面意義上對待基準的方式得出的。
3.42K
29
Connor Davis
11月26日 21:08
Anthropic 剛剛在他們測試過的每位人類工程師中得分最高。 Claude Opus 4.5 昨天推出,超越了 GPT-5.1-Codex-Max、Gemini 3 Pro,以及他們內部編碼考試中的每一位人類候選人。 這裡有些沒有人在談論的事情:
3.17K
32
Connor Davis
11月25日 19:52
最強大的 AI 代理建構工具 👇 1. n8n 2. LangChain 3. CrewAI 4. OpenAI 的代理建構器 你現在在使用哪一個? 我在實際項目中嘗試過所有這些工具,而 n8n 總是顯示出是桌上最強大的工具。它處理實際的工作。雜亂的工作。觸及實際系統的工作,而不是只存在於聊天泡泡中。 這是讓我堅持使用它的原因: n8n 讓我建立可以打開電子郵件、閱讀它們、提取有用數據並將其發送到需要的地方的代理。它讓我將這些代理連接到 CRM、電子表格、數據庫、Slack、Notion、API,以及我的工作流程所依賴的任何其他工具。 我可以堆疊步驟、建立循環、重試任務,並全程可見地觀察一切運行。 LangChain 給了我靈活性,但工作流程很快就變得錯綜複雜。 CrewAI 讓早期實驗變得簡單,但複雜的過程超出了它的極限。 OpenAI 的代理建構器有潛力,但當你需要更深層的控制時,問題很快就會出現。 n8n 處理了從推理到行動的完整流程,而不需要我建立後端或手動將工具粘合在一起。它讓代理感覺像是一個真正的操作員,而不是一個多了幾個步驟的聊天機器人。 真正的轉變發生在我看到如何乾淨地將單一工作流程轉變為可重複的東西時。不是演示,而是一個可運行的系統。商業每天都可以依賴的東西。 如果你今年在建立代理,你選擇的平台將影響一切。 所以我很好奇你在使用哪一個,以及你為什麼選擇它。
4.26K
33
熱門
排行
收藏