跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-7.56%
USELESS
-3.12%
IKUN
-1.74%
gib
-4.57%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+4.06%
ALON
+6.71%
LAUNCHCOIN
-18.85%
GOONC
-9.72%
KLED
-6.17%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.39%
Boopa
+6.96%
PORK
+3.38%
主頁
elie
elie
2025年10月31日
從頭到尾訓練大型語言模型是很困難的。我非常興奮地分享我們的新部落格(書籍?),涵蓋了完整的流程:預訓練、後訓練和基礎設施。200 多頁的內容,講述了什麼有效,什麼無效,以及如何使其可靠運行。
361.92K
2.19K
elie
2025年10月30日
> 建立一個新的基礎模型比微調一個開放模型和優化推理要困難得多。 有點瘋狂的是,大多數初創公司(即使是資金充足的公司)無法建立自己的基礎模型,而是依賴前沿的中國實驗室開源他們的模型..
Nick
2025年10月30日
Cursor 和 Windsurf 釋出針對速度優化的模型的原因是,這比建立一個推動智能的基礎模型要可行得多。 1. 取用 Qwen3,並通過強化學習在你的裝置上進行微調。 2. 將其放在 Cerebras(或優化的 GPU)硬體上。 3. 讓這個中等智能、超快速的模型運行。 對於編碼代理公司來說,如果你想將有價值的東西推向市場,建立一個新的基礎模型比微調一個開放模型並優化推理要困難得多。 坦白說,這是釋放接近帕累托邊界的東西的高效方式,我喜歡編碼代理公司開始參與這一過程。 但不要誤解這為編碼代理公司在宣稱「中等智能但快速 > 高度智能但緩慢」。
38.76K
154
elie
2025年10月27日
我明天會醒來閱讀一份 MiniMax M2 技術報告,相信我
32.71K
72
熱門
排行
收藏