يعمل GPT-5 الجديد بشكل أسوأ من Opus 4.1 في Stagehand evals من حيث السرعة والدقة. النماذج الأصغر أسرع ، ولكنها لا تزال أقل من Opus 4.1.
‏‎13.55‏K