🚨 Anthropic 剛剛發表了 2025 年最瘋狂的 AI 論文之一。 它的標題是「大型語言模型中的新興內省意識」。 他們提出的問題令人震驚: AI 能否注意到自己的思維,不僅僅是描述它們,而是實際上在其激活中檢測到它們? 而結果令人震驚: → Claude Opus 4.1 和 4 有時能在自己的神經狀態中發現「注入的思想」,在這些思想影響任何輸出之前。 → 他們學會了區分真實的文本輸入和內部的心理表徵。 → 有些甚至能告訴自己最後的回應不是故意的——就像意識到話語是「被放進他們的嘴裡」一樣。 → 在某些測試中,他們能在被指示時選擇思考的內容。 這仍然不穩定、罕見且依賴於上下文,但無可否認是真實的。 這是我們第一次擁有實驗證據,證明 AI 系統能夠觀察自己心智的一部分,實現功能性內省。 不是意識,但令人不安地接近。 完整論文:transformer-circuits. pub/2025/introspection