لقد استخدمت Claude لإجراء بعض الاختبارات بين GPT-OSS-120B و Qwen3-Coder-480B و Claude Opus 4 للمهام المتعلقة بالترميز: 1. قراءة وفهم مستودع واجهة المستخدم الرسومية Bitcoin Core 2. تنفيذ نظام ترتيب الصفحات في C ++ كان هذا هو الحكم النهائي: "يوفر GPT-OSS-120B قيمة استثنائية ، مما يجعله الفائز الواضح للمؤسسات التي تتطلع إلى تنفيذ مساعدة ترميز الذكاء الاصطناعي على نطاق واسع. الحد الأدنى من اختلاف الجودة لا يبرر علاوة سعر كلود البالغة 54 ضعفا ". CC @sama @gdb
1. قراءة وفهم مستودع واجهة المستخدم الرسومية Bitcoin Core "تظهر نتائج الاختبار أن GPT-OSS-120B يوفر أفضل توازن بين الأداء والتكلفة لمهام تحليل الكود ، بينما يوفر Claude Opus 4 التحليل الأكثر شمولا بسعر ممتاز."
2. تنفيذ نظام ترتيب الصفحات في C ++ "أفضل توازن: GPT-OSS-120B - جودة كود جيدة (درجة 10/11) - أقل تكلفة - وقت استجابة معقول - يتضمن التنفيذ والاختبارات المتوازية" .. ملخص: - لإنشاء كود الإنتاج ، يوفر GPT-OSS-120B أفضل قيمة - للمهام الحرجة للسرعة ، يوفر Qwen3-Coder-480B الأسرع - للحصول على كود عالي الجودة ، يوفر Claude Opus 4 التنفيذ الأكثر شمولا
‏‎2.6‏K