لقد نفذت DeepSeek للتو نوع الترقية التي تدعي كل نموذج منطقي أنها تمتلكها. بدلا من أن تفرغ سلسلة طويلة من الأفكار والأمل في أن تكون منطقية، تجري DeepSeek Math V2 تحقيقا كاملا على منطقها الخاص. يبني دلا، يهاجمه، يتحقق من الهجوم، يفحص الدقق، يصلح العيوب، ويدور حتى لا يستطيع كسر نفسه بعد الآن. هذه الفكرة الواحدة غيرت أداءه تماما. إليك ما أنتجته تلك المرحلة من التدقيق الذاتي: • الأداء على مستوى الذهب في IMO 2025 • أداء على مستوى ذهبي في CMO 2024 • 118/120 في بوتنام 2024، أعلى درجة تم الإبلاغ عنها • نتائج أفضل من GPT-5 Thinking وGemini 2.5 Pro في أصعب الفئات السر ليس في الحجم. إنها البنية المحيطة بالنموذج: — محقق يبحث عن الثغرات المنطقية — متحقق ميتا يشكك في المتحقق — مولد إثبات مهيأ لتجنب التفكير الضعيف — حلقة تجبر كل جزء من النظام على أن يصبح أكثر حدة تعمل العملية مثل المطحنة: - تقديم برهان - اختبرها - اختبار جهاز الاختبار - إصلاح المنطق -كرر استهدفوا القضية الحقيقية في التفكير الرياضي: يمكن للنموذج أن يصل إلى الإجابة الصحيحة لأسباب خاطئة. لذا دربت DeepSeek محققا يسجل الاستدلال وليس النتائج....