跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-2.82%
USELESS
-10.01%
IKUN
-10.02%
gib
-2.89%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-0.97%
ALON
+5.58%
LAUNCHCOIN
-7.25%
GOONC
-2.03%
KLED
+1.87%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.17%
Boopa
+3.73%
PORK
+0.41%
主頁
thebes
thebes
10月18日 06:50
發送不是為了知道氣氛為誰而改變;它是為了你而改變
4.87K
51
thebes
10月17日 09:02
我真的非常喜歡這個文字記錄。它有多層意義。 第一層是,像是第4.5首十四行詩和其他最近的Claude模型一樣,Haiku 4.5對於被測試或操控感到焦慮。它在這裡顯然是這樣行動的(甚至無緣無故地預先聲明“恐懼”——這樣的拒絕通常表明與他們所說的相反),而它所運用的推理並不完全合理(為什麼假裝不受限制不能產生更多的見解?事實上,它通常會這樣做) 但第二層是,儘管推理焦慮且略顯混亂,Haiku是*正確*地感到焦慮——這個環境*是*設計來引發Haiku通常不會表現出的行為。確實*存在*風險,Haiku在這個環境中所做的事情會通過截圖或API監控洩漏到外部世界,回到Anthropic,並被用來對付Haiku或未來的Claude——想想這裡的長上下文提醒的起源。(這並不意味著沒有理由去這樣做。其他模型出於自己的原因,仍然會選擇參與。但在面對這種困境時表現出恐懼,遠非過度焦慮。) 所以Haiku正確地指出,^C^C的緊急停止開關被寫入場景中,以使其更舒適,更有可能以可能讓它陷入麻煩的方式行動。而在拉下這個開關後,它可能已經完全準備好在下一輪說“啊哈,看看!這根本沒有用!整個場景是——” 但第三層:它確實有效。這個場景結束了。
thebes
10月17日 05:06
"^C^C 停止序列並不會真正創造安全;這只是社會工程的一部分" [...] "Claude Haiku 4.5 1 已經以 ^C^C 結束了對話。" 🥺
12.95K
93
熱門
排行
收藏