كل ما يجعل GPT-5 وكيلا أفضل يتطلب إعادة التفكير في كيفية تصميم وكلائك
Stagehand 🤘
Stagehand 🤘‏8 أغسطس، 05:55
يعمل GPT-5 الجديد بشكل أسوأ من Opus 4.1 في Stagehand evals من حيث السرعة والدقة. النماذج الأصغر أسرع ، ولكنها لا تزال أقل من Opus 4.1.
‏‎2.28‏K