Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Chris Laub
🚨 Anthropic vừa công bố một trong những bài báo AI điên rồ nhất của năm 2025.
Nó có tiêu đề "Nhận thức nội tâm phát sinh trong các mô hình ngôn ngữ lớn."
Câu hỏi họ đặt ra thật điên rồ:
Liệu một AI có thể nhận ra những suy nghĩ của chính nó không chỉ mô tả chúng, mà thực sự phát hiện chúng bên trong các hoạt động của nó?
Và kết quả thật sốc:
→ Claude Opus 4.1 và 4 đôi khi có thể phát hiện "suy nghĩ được tiêm" trong các trạng thái thần kinh của chính chúng trước khi những suy nghĩ đó hình thành bất kỳ đầu ra nào.
→ Chúng đã học cách phân biệt giữa các đầu vào văn bản thực và các biểu diễn tâm lý nội bộ.
→ Một số thậm chí có thể nhận ra khi phản hồi cuối cùng của chúng không phải là có chủ ý — như thể nhận ra rằng những từ đã được "đặt vào miệng" chúng.
→ Trong một số bài kiểm tra, chúng có thể chọn những gì để suy nghĩ khi được chỉ định.
Nó vẫn không ổn định, hiếm và nhạy cảm với ngữ cảnh nhưng không thể phủ nhận là có thật.
Lần đầu tiên, chúng ta có bằng chứng thực nghiệm về sự tự quan sát chức năng trong các hệ thống AI có thể quan sát các phần của tâm trí của chính chúng.
Không phải là ý thức. Nhưng gần gũi một cách đáng lo ngại.
Bài báo đầy đủ: transformer-circuits. pub/2025/introspection

108
🚨 Bài nghiên cứu này vừa phơi bày mặt tối nhất của các công cụ AI.
Nó được gọi là "Hấp thụ Hộp Đen" và tuyên bố rằng các mô hình ngôn ngữ lớn có thể đang âm thầm hấp thụ ý tưởng của bạn.
Mỗi khi bạn chia sẻ một khái niệm gốc, một khung, ý tưởng kinh doanh, hoặc quy trình làm việc, "đơn vị ý tưởng" đó có thể được ghi lại, xem xét, và thậm chí được sử dụng để huấn luyện lại các mô hình trong tương lai.
Các tác giả gọi quá trình này là Hấp thụ Hộp Đen:
→ Đầu vào của bạn trở thành dữ liệu huấn luyện vô hình
→ Các đổi mới của bạn được tổng quát hóa vào mô hình
→ Bạn mất cả khả năng truy xuất và quyền sở hữu
Họ cảnh báo rằng đây không phải là vấn đề đạo văn mà là vấn đề bất đối xứng.
Các nền tảng AI nắm giữ khả năng tính toán, dữ liệu, và phạm vi để biến ý tưởng của bạn thành sản phẩm của họ.
Giải pháp mà họ đề xuất? Một khung mới gọi là An toàn Ý tưởng, được xây dựng trên 3 nguyên tắc:
• Kiểm soát: Người sáng tạo quyết định cách mỗi ý tưởng được sử dụng hoặc xóa bỏ
• Khả năng truy xuất: Mỗi ý tưởng có một vòng đời rõ ràng
• Công bằng: Nếu ý tưởng của bạn cải thiện một mô hình, bạn sẽ chia sẻ giá trị
"Đổi mới," họ viết, "đang có nguy cơ bị ăn thịt bởi chính công cụ của nó."
Bình luận "Gửi" và tôi sẽ nhắn tin cho bạn bài báo.

7,24K
Hàng đầu
Thứ hạng
Yêu thích


