跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-1.24%
USELESS
+0.87%
IKUN
-14.36%
gib
-8.25%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.03%
ALON
-2.07%
LAUNCHCOIN
-10.7%
GOONC
-4.02%
KLED
-2.13%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.07%
Boopa
+2.75%
PORK
+18.44%
主頁
Y
語言與思想
查看原文
Y
2025年10月31日
🚀 HLA: 更高的線性注意力 = 注意力氛圍 + RNN 速度: 更高階的線性注意力,具備可並行訓練的特性! 專案頁面: 我們回來了! 🚀 #LLM #AI #DeepLearning #Transformers
35.64K
125
Y
2025年10月31日
告別,旋轉位置嵌入(RoPE)。我們預見 RoPE 將不再在未來的 LLM 中使用。 一些重要的事情已經揭示出來;答案就在這張圖片中。敬請期待!🚀
38.24K
182
Y
2025年10月27日
💡一些關於 Minimax M2 的有趣事實: 1. Minimax 使用類似 GPT-OSS 的結構,即全注意力與滑動窗口注意力(SWA)交錯。 2. 它使用 QK Norm,每個注意力頭都有自己獨特的、可學習的 RMSNorm。 3. 全注意力和 SWA 部分甚至不共享設置:它們各自擁有自己的 RoPE theta 配置。 還有一件事……有人可能會問為什麼不使用線性注意力(加法規則或增量規則) ⚡️答案很明確:FlashAttention(Dao 等人)是如此有效,支持低精度訓練和推理(FP8/FP4),而線性注意力在低精度下無法工作! 很高興看到越來越多的 AI 實驗室在做真正的科學,而不是驕傲與偏見!😃
Skyler Miao
2025年10月24日
MiniMax M2: Our advanced model that achieves global Top 5 status, surpassing Claude Opus 4.1 and ranking just behind Sonnet 4.5. Coming October 27th - Stay Tuned
135.42K
585
熱門
排行
收藏