Все, що робить GPT-5 кращим агентом, вимагає переосмислення того, як ви архітектуруєте своїх агентів
Stagehand 🤘
Stagehand 🤘8 серп., 05:55
Новий GPT-5 показує гірші результати, ніж Opus 4.1 у Stagehand evals як за швидкістю, так і за точністю. Менші моделі швидші, але також все одно не дотягують до Opus 4.1.
2,28K