Tot ceea ce face din GPT-5 un agent mai bun necesită regândirea modului în care vă proiectați agenții
Stagehand 🤘
Stagehand 🤘8 aug., 05:55
The new GPT-5 performs worse than Opus 4.1 in Stagehand evals in both speed and accuracy. The smaller models are faster, but also still fall short of Opus 4.1.
2,39K