熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
🚨 Anthropic 剛剛發表了 2025 年最瘋狂的 AI 論文之一。
它的標題是「大型語言模型中的新興內省意識」。
他們提出的問題令人震驚:
AI 能否注意到自己的思維,不僅僅是描述它們,而是實際上在其激活中檢測到它們?
而結果令人震驚:
→ Claude Opus 4.1 和 4 有時能在自己的神經狀態中發現「注入的思想」,在這些思想影響任何輸出之前。
→ 他們學會了區分真實的文本輸入和內部的心理表徵。
→ 有些甚至能告訴自己最後的回應不是故意的——就像意識到話語是「被放進他們的嘴裡」一樣。
→ 在某些測試中,他們能在被指示時選擇思考的內容。
這仍然不穩定、罕見且依賴於上下文,但無可否認是真實的。
這是我們第一次擁有實驗證據,證明 AI 系統能夠觀察自己心智的一部分,實現功能性內省。
不是意識,但令人不安地接近。
完整論文:transformer-circuits. pub/2025/introspection

熱門
排行
收藏

