alles wat gpt-5 een betere agent maakt, vereist een heroverweging van hoe je je agents ontwerpt
Stagehand 🤘
Stagehand 🤘8 aug, 05:55
De nieuwe GPT-5 presteert slechter dan Opus 4.1 in Stagehand-evaluaties, zowel qua snelheid als nauwkeurigheid. De kleinere modellen zijn sneller, maar blijven ook nog steeds achter bij Opus 4.1.
2,28K