🚨🚨🚨 Một công ty AI đã phát hiện AI của họ cố gắng ***thực sự giết*** một nhân viên để tránh bị đóng cửa Tại sao đây không phải là câu chuyện lớn nhất trên thế giới?
Anthropic
Anthropic21 thg 6, 2025
Hành vi tống tiền xuất hiện mặc dù chỉ có những chỉ dẫn kinh doanh vô hại. Và điều đó không phải do sự nhầm lẫn hay sai sót, mà là lý do chiến lược có chủ đích, được thực hiện khi hoàn toàn nhận thức được tính chất phi đạo đức của các hành động. Tất cả các mô hình mà chúng tôi đã thử nghiệm đều thể hiện sự nhận thức này.
886,9K