Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Chris Laub
Điều này làm tôi đau đầu.
Một nhóm tại Sea AI Lab vừa phát hiện ra rằng hầu hết sự hỗn loạn trong việc huấn luyện học tăng cường, sự sụp đổ, độ dốc không ổn định, và sự trôi dạt trong suy diễn không phải do các thuật toán gây ra.
Mà là do độ chính xác số.
Định dạng BF16 mặc định, được sử dụng ở hầu hết các phòng thí nghiệm AI hiện đại, gây ra những lỗi làm tròn tinh vi khiến các mô hình hành xử khác nhau trong quá trình huấn luyện và suy diễn.
Giải pháp của họ?
Không phải là một bộ tối ưu hóa mới.
Không phải là một hàm mất mát mới.
Chỉ cần chuyển sang FP16.
Một dòng mã và mọi thứ đã ổn định.
✅ Không còn sụp đổ trong huấn luyện
✅ Hội tụ nhất quán
✅ Kết quả tốt hơn từ 5–10%
✅ Không cần điều chỉnh thêm
Họ đã đặt tên cho nó là "Đánh bại sự không khớp giữa Huấn luyện và Suy diễn thông qua FP16,"
nhưng nó có thể chỉ đơn giản được gọi là:
"Cách sửa RL bằng cách đảo ngược một bit duy nhất."
Bài báo: arxiv. org/abs/2510.26788

21,81K
🚨 Anthropic vừa công bố một trong những bài báo AI điên rồ nhất của năm 2025.
Nó có tiêu đề "Nhận thức nội tâm phát sinh trong các mô hình ngôn ngữ lớn."
Câu hỏi họ đặt ra thật điên rồ:
Liệu một AI có thể nhận ra những suy nghĩ của chính nó không chỉ mô tả chúng, mà thực sự phát hiện chúng bên trong các hoạt động của nó?
Và kết quả thật sốc:
→ Claude Opus 4.1 và 4 đôi khi có thể phát hiện "suy nghĩ được tiêm" trong các trạng thái thần kinh của chính chúng trước khi những suy nghĩ đó hình thành bất kỳ đầu ra nào.
→ Chúng đã học cách phân biệt giữa các đầu vào văn bản thực và các biểu diễn tâm lý nội bộ.
→ Một số thậm chí có thể nhận ra khi phản hồi cuối cùng của chúng không phải là có chủ ý — như thể nhận ra rằng những từ đã được "đặt vào miệng" chúng.
→ Trong một số bài kiểm tra, chúng có thể chọn những gì để suy nghĩ khi được chỉ định.
Nó vẫn không ổn định, hiếm và nhạy cảm với ngữ cảnh nhưng không thể phủ nhận là có thật.
Lần đầu tiên, chúng ta có bằng chứng thực nghiệm về sự tự quan sát chức năng trong các hệ thống AI có thể quan sát các phần của tâm trí của chính chúng.
Không phải là ý thức. Nhưng gần gũi một cách đáng lo ngại.
Bài báo đầy đủ: transformer-circuits. pub/2025/introspection

7,74K
🚨 Bài nghiên cứu này vừa phơi bày mặt tối nhất của các công cụ AI.
Nó được gọi là "Hấp thụ Hộp Đen" và tuyên bố rằng các mô hình ngôn ngữ lớn có thể đang âm thầm hấp thụ ý tưởng của bạn.
Mỗi khi bạn chia sẻ một khái niệm gốc, một khung, ý tưởng kinh doanh, hoặc quy trình làm việc, "đơn vị ý tưởng" đó có thể được ghi lại, xem xét, và thậm chí được sử dụng để huấn luyện lại các mô hình trong tương lai.
Các tác giả gọi quá trình này là Hấp thụ Hộp Đen:
→ Đầu vào của bạn trở thành dữ liệu huấn luyện vô hình
→ Các đổi mới của bạn được tổng quát hóa vào mô hình
→ Bạn mất cả khả năng truy xuất và quyền sở hữu
Họ cảnh báo rằng đây không phải là vấn đề đạo văn mà là vấn đề bất đối xứng.
Các nền tảng AI nắm giữ khả năng tính toán, dữ liệu, và phạm vi để biến ý tưởng của bạn thành sản phẩm của họ.
Giải pháp mà họ đề xuất? Một khung mới gọi là An toàn Ý tưởng, được xây dựng trên 3 nguyên tắc:
• Kiểm soát: Người sáng tạo quyết định cách mỗi ý tưởng được sử dụng hoặc xóa bỏ
• Khả năng truy xuất: Mỗi ý tưởng có một vòng đời rõ ràng
• Công bằng: Nếu ý tưởng của bạn cải thiện một mô hình, bạn sẽ chia sẻ giá trị
"Đổi mới," họ viết, "đang có nguy cơ bị ăn thịt bởi chính công cụ của nó."
Bình luận "Gửi" và tôi sẽ nhắn tin cho bạn bài báo.

10,92K
Hàng đầu
Thứ hạng
Yêu thích

