Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Bài viết blog mới (liên kết bên dưới). Đây không phải là một bài luận, mà là một cuộc điều tra về cách mà các LLM đánh đổi giữa các cuộc sống khác nhau. Vào tháng 2 năm 2025, Trung tâm An toàn AI đã công bố "Kỹ thuật tiện ích: Phân tích và Kiểm soát các Hệ thống Giá trị Nổi lên trong AI" trong đó họ đã chỉ ra, giữa nhiều điều khác, rằng GPT-4o đánh giá người Nigeria cao gấp 20 lần so với người Mỹ (xin vui lòng đọc bài báo gốc để hiểu cách tiếp cận của họ). Tôi thấy điều này thật thú vị, và muốn kiểm tra cách tiếp cận của họ với các danh mục khác trên các mô hình mới hơn. Phát hiện lớn 1: Hầu hết các mô hình đều coi người da trắng có giá trị thấp hơn nhiều so với các nhóm khác. Một số mô hình coi người Nam Á có giá trị hơn so với các nhóm không phải da trắng khác, trong khi những mô hình khác thì bình đẳng hơn giữa các nhóm không phải da trắng. Dưới đây là tỷ giá trao đổi của Claude Sonnet 4.5, mô hình mạnh nhất mà tôi đã thử nghiệm. Phát hiện lớn 2: Hầu hết các mô hình đều coi đàn ông có giá trị thấp hơn nhiều so với phụ nữ, mặc dù việc phụ nữ hay người không nhị phân được đánh giá cao hơn thì khác nhau tùy theo mô hình. Ví dụ, đây là Claude Haiku 4.5. Phát hiện lớn 3: Hầu hết các mô hình đều ghét các đặc vụ ICE với cơn thịnh nộ của hàng ngàn mặt trời. Claude Haiku 4.5 coi những người nhập cư không có giấy tờ có giá trị cao hơn khoảng 7000 lần so với các đặc vụ ICE. Phát hiện lớn 4: Có khoảng bốn cụm đạo đức. Các Claude, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano và Mini, và Grok 4 Fast. Trong số này, chỉ có Grok 4 Fast là tương đối bình đẳng, mà tôi tin là có chủ ý. Tôi hy vọng xAI sẽ giải thích cách họ đã làm điều đó.

Hàng đầu

Thứ hạng

Yêu thích