Il nuovo GPT-5 si comporta peggio di Opus 4.1 nelle valutazioni di Stagehand sia in termini di velocità che di accuratezza. I modelli più piccoli sono più veloci, ma comunque non raggiungono Opus 4.1.
13,53K