قمنا بتقييم GPT-5 في OpenHands وهو نموذج وكيل الترميز رقم واحد الجديد بالنسبة لنا! باستخدام نفس الأدوات وتسخيرها بالضبط ، فهي أفضل بمقدار 1.4 نقطة من Claude Sonnet 4 بنسبة 60٪ من السعر. النتائج الكاملة هنا:
‏‎29.16‏K