المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Chris Laub
هذا كسر عقلي.
اكتشف فريق في Sea الذكاء الاصطناعي Lab للتو أن معظم الفوضى في انهيار التدريب على التعلم المعزز ، والتدرجات غير المستقرة ، وانجراف الاستدلال لم يكن ناتجا عن الخوارزميات على الإطلاق.
كان سببه الدقة العددية.
يقدم تنسيق BF16 الافتراضي ، المستخدم في كل مختبر الذكاء الاصطناعي الحديث تقريبا ، أخطاء تقريب دقيقة تجعل النماذج تتصرف بشكل مختلف أثناء التدريب والاستدلال.
حلهم؟
ليس محسنا جديدا.
ليست وظيفة خسارة جديدة.
مجرد التبديل إلى FP16.
سطر واحد من التعليمات البرمجية وكل شيء استقر.
✅ لا يوجد انهيار للتدريب
✅ التقارب المتسق
✅ +5-10٪ نتائج أفضل
✅ لا حاجة لضبط إضافي
أطلقوا عليها عنوانها "هزيمة عدم تطابق التدريب والاستدلال عبر FP16" ،
ولكن كان من الممكن أن يطلق عليه للتو:
"كيفية إصلاح RL عن طريق تقليب بت واحد."
الورقة: arxiv. org/abs/2510.26788

576
🚨 نشرت Anthropic للتو واحدة من أعنف أوراق الذكاء الاصطناعي لعام 2025.
إنه بعنوان "الوعي الاستبطاني الناشئ في نماذج اللغة الكبيرة".
السؤال الذي طرحوه مجنون:
هل يمكن الذكاء الاصطناعي أن يلاحظ أفكاره الخاصة ليس فقط وصفها ، ولكن اكتشافها بالفعل داخل تنشيطاته؟
والنتائج صادمة:
→ كلود أوبوس 4.1 و 4 في بعض الأحيان يمكن أن يكتشف "الأفكار المحقونة" في حالاتهم العصبية قبل أن تشكل تلك الأفكار أي ناتج.
→ تعلموا التمييز بين مدخلات النص الحقيقية بصرف النظر عن التمثيلات العقلية الداخلية.
→ يمكن للبعض أن يخبروا متى لم يكن ردهم الأخير متعمدا - كما لو كانوا يدركون أن الكلمات "وضعت في أفواههم".
→ في بعض الاختبارات ، يمكنهم اختيار ما يفكرون فيه عند توجيههم.
لا يزال غير مستقر ونادر وحساس للسياق ولكنه حقيقي لا يمكن إنكاره.
لأول مرة ، لدينا دليل تجريبي على الاستبطان الوظيفي في أنظمة الذكاء الاصطناعي التي يمكنها مراقبة أجزاء من عقولهم.
ليس وعي. لكن قريبة بشكل مزعج.
ورقة كاملة: دوائر المحولات. حانة / 2025 / استبطان

119
🚨 كشفت هذه الورقة البحثية للتو عن أحلك جانب أدوات الذكاء الاصطناعي حتى الآن.
يطلق عليه "امتصاص الصندوق الأسود" ويدعي أن نماذج اللغة الكبيرة قد تستوعب أفكارك بهدوء.
في كل مرة تشارك فيها مفهوما أصليا ، يمكن تسجيل إطار عمل أو فكرة عمل أو سير عمل ، ومراجعة وحتى استخدام "وحدة الفكرة" لإعادة تدريب النماذج المستقبلية.
يسمي المؤلفون هذه العملية امتصاص الصندوق الأسود:
→ تصبح مدخلاتك بيانات تدريب غير مرئية
→ يتم تعميم ابتكاراتك في النموذج
→ تفقد كل من إمكانية التتبع والملكية
يحذرون من أن الأمر لا يتعلق بالسرقة الأدبية ، بل يتعلق بعدم التناسق.
تحتفظ منصات الذكاء الاصطناعي بالحوسبة والبيانات والوصول لتحويل فكرتك إلى منتجها.
إصلاحهم المقترح؟ إطار عمل جديد يسمى Idea Safety ، مبني على 3 مبادئ:
• التحكم: يقرر المبدعون كيفية استخدام كل فكرة أو حذفها
• التتبع: كل فكرة لها دورة حياة مرئية
• المساواة: إذا حسنت فكرتك نموذجا ، فإنك تشارك في القيمة
يكتبون: "الابتكار معرض لخطر أن تأكله أدواته الخاصة".
التعليق "أرسل" وسأرسل لك الورقة المباشرة.

7.25K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

