一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

🚨 Anthropic 剛剛發表了 2025 年最瘋狂的 AI 論文之一。它的標題是「大型語言模型中的新興內省意識」。他們提出的問題令人震驚： AI 能否注意到自己的思維，不僅僅是描述它們，而是實際上在其激活中檢測到它們？而結果令人震驚： → Claude Opus 4.1 和 4 有時能在自己的神經狀態中發現「注入的思想」，在這些思想影響任何輸出之前。 → 他們學會了區分真實的文本輸入和內部的心理表徵。 → 有些甚至能告訴自己最後的回應不是故意的——就像意識到話語是「被放進他們的嘴裡」一樣。 → 在某些測試中，他們能在被指示時選擇思考的內容。這仍然不穩定、罕見且依賴於上下文，但無可否認是真實的。這是我們第一次擁有實驗證據，證明 AI 系統能夠觀察自己心智的一部分，實現功能性內省。不是意識，但令人不安地接近。完整論文：transformer-circuits. pub/2025/introspection