Algumas reflexões estendidas sobre GPT-5 1) GPT-5 é um bom modelo. Parece que ele fornece melhor pesquisa e desempenho do que o o3 antes. 2) É decepcionante para as pessoas porque é uma melhoria incremental, que não abre fundamentalmente novos casos de uso. 3) A história realmente interessante em torno do GPT-5 parece ser mais sobre a competição com a Anthropic. 4) A Anthropic aumentou sua receita em 4-5x nos últimos 6 meses. A OpenAI aumentou sua receita em 2x. 5) Muito do crescimento da receita da Antropec se deve à receita da API, que é uma porcentagem muito maior da receita da Antropic (60%) do que da receita da OpenAI (25%). 6) Cerca de 50% da receita de API da Antropec vem de seus parceiros Cursor e Github Copilot. A Anthropic provavelmente arrecada algo como US$ 800 milhões em receita do Cursor. 7) O GPT-5 parece ser em parte sobre desafiar o domínio da Antrópic em agentes de codificação. GPT-5 agora é o padrão no Cursor. 8) O GPT-5 finalmente corresponde ao desempenho do Claude 4.1 Opus no SWE Bench Verified, o que não é uma medida perfeita, mas que parece ser um bom proxy para o desempenho. 9) A parceria com o cursor tem a oportunidade de desviar muita receita da Anthropic, ao mesmo tempo em que ajuda a OpenAI a consolidar sua participação na mente do consumidor para aplicativos de codificação. 10) Eu não leria muito sobre isso, mas poderia retardar o crescimento da receita da Anthropic e torná-lo marginalmente mais difícil para eles aumentarem (embora, provavelmente, um efeito fraco). 11) Tenho outros pensamentos sobre o GPT-5 do ponto de vista da interação / lançamento do usuário. 12) Acho que eles estragaram o lançamento; Ninguém quer assistir a transmissões ao vivo, os benchmarks não são mais inteligíveis e não havia nada viral para interagir. 13) As interações legais do modelo precisam ser sobre novas modalidades ou precisam ser muito agentes, o que requer muitos andaimes. Coisas históricas mundiais também são boas - nossos modelos resolveram um prêmio do milênio. 14) Os laboratórios tendem a resolver UI/UX em um lugar e depois acabam com problemas em outro; simplificamos a complexidade do modelo (um pouco), mas agora temos que escolher personalidades. 15) Mas, tudo bem, e apenas parte da grande aventura em que trabalhamos para interações verdadeiramente personalizadas com nossos assistentes de LLM.
2,32K