Algumas reflexões extensas sobre o GPT-5 1) O GPT-5 é um bom modelo. Parece que oferece uma melhor pesquisa e desempenho do que o o3 oferecia antes. 2) É decepcionante para as pessoas porque é uma melhoria incremental, que não abre novos casos de uso fundamentalmente novos. 3) A história realmente interessante em torno do GPT-5 parece ser mais sobre a competição com a Anthropic. 4) A Anthropic aumentou sua receita em 4-5x nos últimos 6 meses. A OpenAI aumentou sua receita em 2x. 5) Grande parte do crescimento da receita da Anthropic se deve à receita da API, que é uma porcentagem muito maior da receita da Anthropic (60%) do que a receita da OpenAI (25%). 6) Cerca de 50% da receita da API da Anthropic vem de seus parceiros Cursor e Github Copilot. A Anthropic provavelmente arrecada algo em torno de $800 milhões em receita do Cursor. 7) O GPT-5 parece ser em parte sobre desafiar a dominância da Anthropic em agentes de codificação. O GPT-5 agora é o padrão no Cursor. 8) O GPT-5 finalmente iguala o desempenho do Claude 4.1 Opus no SWE Bench Verified, que não é uma medida perfeita, mas parece ser um bom proxy para desempenho. 9) A parceria com o cursor tem a oportunidade de desviar muita receita da Anthropic, enquanto ajuda a OpenAI a consolidar sua participação na mente do consumidor para aplicações de codificação. 10) Eu não leria muito nisso, mas isso poderia desacelerar o crescimento da receita da Anthropic e tornar um pouco mais difícil para eles arrecadarem (embora, provavelmente, um efeito fraco). 11) Tenho outros pensamentos sobre o GPT-5 a partir de uma perspectiva de interação do usuário / lançamento. 12) Acho que eles estragaram o lançamento; ninguém quer assistir transmissões ao vivo, os benchmarks não são mais inteligíveis, e não havia nada viral para interagir. 13) Interações legais com modelos precisam ser sobre novas modalidades ou precisam ser muito agentivas, o que requer muita estrutura. Coisas históricas mundiais também são boas - nossos modelos resolveram um prêmio milenar. 14) Os laboratórios tendem a resolver UI/UX em um lugar e depois acabam com problemas em outro; simplificamos a complexidade do modelo (um pouco), mas agora temos que escolher personalidades. 15) Mas, isso está ok, e é apenas parte da grande aventura onde trabalhamos em direção a interações verdadeiramente personalizadas com nossos assistentes LLM.
2,16K