GPT-5 baru berkinerja lebih buruk daripada Opus 4.1 di Stagehand evals dalam kecepatan dan akurasi. Model yang lebih kecil lebih cepat, tetapi juga masih kurang dari Opus 4.1.
13,53K