لقد رأيت مجموعة من الأشخاص يتحدثون عن كيف وجدوا أن GPT-5 هو خطوة إلى أسفل عن الطرز السابقة. لا أستطيع التحدث عن تجربتهم ، لكن تجربتي كانت عكس ذلك. بالأمس ، كان لدي GPT-5 Thinking تصميم لغة معقدة خاصة بالمجال بالنسبة لي لتحديد دلالات تعليمات الماكينة في وحدات المعالجة المركزية. (الغرض من هذا الشيء هو تسهيل إنشاء وصيانة المحاكيات لأجهزة الكمبيوتر القديمة ، وهي هواية لي.) لم يكن LLM مثاليا ولكنه قام بعمل ممتاز وأظهر بعض الإبداع الحقيقي في المهمة. يعد DSL الناتج ممتازا وكان سيتطلب الكثير من العمل إذا كنت قد فعلت ذلك يدويا. لم أنتهي من العمل مع LLM بشكل كامل على المواصفات ، ولكن عندما أفعل ذلك ، أظن أنه سيكون قادرا على إطلاق النار على معظم المترجم. ربما بالنسبة لبعض الناس ، فإن الشيء يعمل بشكل سيء. لا أعرف ما الذي يحاولون فعله. لا يمكنني أيضا التحدث إلى أذواقهم حول أشياء مثل "الشخصية" ، وإلى جانب ذلك ، يطلب نظامي سريع ضمنيا من النموذج أن يكون محترفا للغاية ولطيفا. (ليس لدي أي اهتمام أيضا ب الذكاء الاصطناعي الذي يوفر لي الرفقة أو الدعم العاطفي ولا أريد أن تكون لدي علاقة شبه اجتماعية معه.) بالنسبة لي ، من المؤكد أنها تقوم بعمل جيد حقا ، وفي مهمة فنية معقدة للغاية. لاحظ أنني أفهم العمل الذي أطلب من النظام القيام به بشكل جيد للغاية ، وأنا في وضع يسمح لي باكتشاف الأخطاء التي يرتكبها وتصحيحها ، وأنا أعتبر الوظيفة التي تم إنجازها بنسبة 95٪ بعد بضع تكرارات هي نتيجة جيدة حقا لأنني أستطيع تصحيح الباقي. ربما إذا كنت تحاول الحصول على شيء واحد لتصوير تصميم دائرة العمل ولا تعرف أي هندسة كهربائية ، فإن الشيء لا يزال لا يفعل ما تريد. بالنسبة لي ، على الرغم من ذلك ، إنها أداة رائعة ، وهي تحسن واضح على o3.
أرى الكثير من الشكاوى حول كون الشخصية "مثل سكرتير مرهق" ، ولم أختبر أي شيء من هذا القبيل ، ولكن مرة أخرى ، أستخدم موجه النظام ويبدو أن معظم الناس لا يفعلون ذلك ، ولا أستخدم أبدا النموذج غير المنطقي ، ويبدو أن معظم الناس يستخدمون فقط النسخة غير المنطقية من النموذج.
‏‎43.48‏K