GPT-5 supera Claude Opus 4.1 em codificação e se torna o melhor modelo de codificação do mundo! Atinge 74,9% no SWE-Bench, superando os 74,5% do Claude Opus 4.1. Isso terá grandes implicações para a avaliação da Anthropic...
É engraçado que eles pensem: - 52,8 > 69,1 - 69,1 = 30,8
132,66K