跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-9.67%
USELESS
-1.21%
IKUN
-3.6%
gib
-0.08%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.9%
ALON
-6.96%
LAUNCHCOIN
-17.43%
GOONC
+2.25%
KLED
-9.47%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.17%
Boopa
-8.57%
PORK
+4.94%
主頁
John Schulman
最近開始@thinkymachines。對強化學習、對齊、鳥、爵士樂感興趣
查看原文
John Schulman
2025年10月31日
jack-o-lora
25.69K
321
John Schulman
2025年10月26日
很高興分享一篇新論文!設計模型行為是困難的——理想的價值觀往往朝相反的方向拉扯。Jifan 的方法系統性地生成價值觀衝突的場景,幫助我們看到規範缺乏覆蓋的地方,以及不同模型如何平衡取捨。
Jifan Zhang
2025年10月25日
與Anthropic和Thinking Machines合作的新研究論文 AI公司使用模型規範來定義訓練期間期望的行為。模型規範是否清楚地表達了我們希望模型做什麼?不同的前沿模型是否有不同的個性? 我們生成了數千個場景來找出答案。🧵
106.79K
613
熱門
排行
收藏