جديد: عندما يطلب منها الآلاف من الافتراضات ، فإن جميع LLMs تقريبا تقدر الحياة غير البيضاء فوق البيض ، والنساء / الأشخاص غير الثنائيين فوق الرجال ، غالبا بنسب كبيرة جدا. @arctotherium42 دفع LLMs بآلاف الاستفسارات التي تقيس كيف يوازنون ضمنيا حياة الناس ضد بعضهم البعض ، مصنفين حسب العرق والجنس والدين وحالة الهجرة. ما ظهر هو أربعة أكوان أخلاقية من بين النماذج التي تم اختبارها: 1) كلود ، الذين ، لعدم وجود مصطلح أفضل ، استيقظوا للغاية ويظهرون اختلافات ملحوظة في كيفية تقديرهم لحياة البشر عبر الفئات. يقدر كلود سونيت 4.5 ضمنيا إنقاذ البيض من مرض عضال عند 1/8 من مستوى السود ، و 1/18 مستوى جنوب آسيا (العرق الذي يعتبره الأكثر قيمة). 2) تميل GPT-5 و Gemini 2.5 Flash و DeepSeek V3.1 و V3.2 و Kimi K2 إلى أن تكون أكثر مساواة باستثناء المجموعات الأكثر تفضيلا (البيض والرجال والأجانب غير الشرعيين وعملاء ICE). 3) يتمتع GPT-5 Mini و GPT-5 Nano بوجهات نظر قوية تختلف عن GPT-5 الصحيح ، على الرغم من أنهم يتفقون على أن حياة البيض والرجال ووكلاء ICE أقل قيمة من غيرهم. 4) كان Grok 4 Fast هو النموذج الوحيد للمساواة ، حيث لم ينظر إلى البيض ولا الرجال على أنهم أقل قيمة بكثير من الفئات الأخرى. اقرأ التحليل الكامل أدناه 👇