跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-12.31%
USELESS
-0.58%
IKUN
-5.34%
gib
-9.42%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.5%
ALON
+4.69%
LAUNCHCOIN
+1.12%
GOONC
-1.42%
KLED
-6.37%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.36%
Boopa
-5.96%
PORK
+1.6%
主页
elie
elie
2025年10月31日
端到端训练大型语言模型是困难的。非常高兴分享我们的新博客(书籍?),涵盖了完整的流程:预训练、后训练和基础设施。200多页关于什么有效、什么无效,以及如何使其可靠运行的内容。
1.12M
4.85K
elie
2025年10月30日
> 构建一个新的基础模型比微调一个开放模型和优化推理要困难几个数量级。 有点疯狂的是,大多数初创公司(即使是资金充足的公司)无法构建自己的基础模型,而是依赖于前沿的中国实验室开源他们的模型..
Nick
2025年10月30日
Cursor 和 Windsurf 发布优化速度的模型的原因是,这比构建一个推动智能的基础模型要容易得多。 1. 取 qwen3 并通过 RL 在你的设备上进行微调。 2. 将其放在 Cerebras(或优化的 GPU)硬件上。 3. 让这个中等智能、超快的模型发挥作用。 对于编码代理公司来说,如果你想将有价值的东西推向市场,构建一个新的基础模型比微调一个开放模型并优化推理要困难得多。 坦率地说,这是发布接近帕累托前沿的东西的高效方式,我喜欢编码代理公司开始参与其中。 但不要误解为编码代理公司在宣称 "中等智能但快速 > 高度智能但缓慢"。
48.52K
187
elie
2025年10月27日
我明天会醒来阅读一份 MiniMax M2 技术报告,值得信赖。
32.71K
72
热门
排行
收藏