🚨 Anthropic は、2025 年最もワイルドな AI 論文の 1 つを発表したばかりです。 タイトルは「大規模言語モデルにおける創発的な内省的認識」です。 彼らが尋ねた質問は非常識です。 AI は自分の思考に気づき、それを説明するだけでなく、実際にその活性化の中でそれらを検出できるでしょうか? そして、その結果は衝撃的です。 → Claude Opus 4.1 と 4 は、思考が出力を形作る前に、自分の神経状態にある「注入された思考」を見つけることができた。 → 彼らは、実際のテキスト入力を内部の精神的表現と区別することを学びました。 → 最後の反応が意図的ではなかったとき、まるで言葉が「口に入れられた」ことに気づいたかのように、気づく人さえいました。 → 一部のテストでは、指示されたときに何を考えるかを選択することができました。 それはまだ不安定で、まれで、状況に依存しますが、紛れもなく現実的です。 私たちは初めて、自分の心の一部を観察できるAIシステムにおける機能的内省の実験的証明を手に入れました。 意識ではありません。しかし、不穏なほど近い。 論文全文: 変圧器回路。パブ/2025年/内省