Quelques réflexions approfondies sur GPT-5 1) GPT-5 est un bon modèle. On a l'impression qu'il offre une meilleure recherche et performance que l'o3 avant lui. 2) C'est décevant pour les gens car c'est une amélioration incrémentale, qui n'ouvre pas fondamentalement de nouveaux cas d'utilisation. 3) L'histoire vraiment intéressante autour de GPT-5 semble être davantage axée sur la concurrence avec Anthropic. 4) Anthropic a multiplié ses revenus par 4-5x au cours des 6 derniers mois. OpenAI a multiplié ses revenus par 2x. 5) Une grande partie de la croissance des revenus d'Anthropic est due aux revenus API, qui représentent un pourcentage beaucoup plus important des revenus d'Anthropic (60%) que ceux d'OpenAI (25%). 6) Environ 50% des revenus API d'Anthropic proviennent de ses partenaires Cursor et Github Copilot. Anthropic collecte probablement quelque chose comme 800 millions de dollars de revenus grâce à Cursor. 7) GPT-5 semble en partie viser à contester la domination d'Anthropic dans les agents de codage. GPT-5 est désormais le modèle par défaut dans Cursor. 8) GPT-5 égalise enfin la performance de Claude 4.1 Opus sur SWE Bench Verified, qui n'est pas une mesure parfaite mais qui semble être un bon proxy pour la performance. 9) Le partenariat avec Cursor a l'opportunité de détourner beaucoup de revenus d'Anthropic, tout en aidant OpenAI à consolider sa part d'esprit des consommateurs pour les applications de codage. 10) Je ne voudrais pas trop y réfléchir, mais cela pourrait ralentir la croissance des revenus d'Anthropic et rendre un peu plus difficile leur levée de fonds (bien que cela soit probablement un effet faible). 11) J'ai d'autres réflexions sur GPT-5 d'un point de vue interaction utilisateur / lancement. 12) Je pense qu'ils ont raté le lancement ; personne ne veut regarder des flux en direct, les benchmarks ne sont plus intelligibles, et il n'y avait rien de viral avec quoi interagir. 13) Les interactions de modèle intéressantes doivent concerner de nouvelles modalités ou doivent être très agentiques, ce qui nécessite beaucoup de structures. Les choses historiques mondiales sont également bonnes - nos modèles ont résolu un prix du millénaire. 14) Les laboratoires ont tendance à résoudre l'UI/UX à un endroit et finissent par avoir des problèmes ailleurs ; nous simplifions la complexité du modèle (dans une certaine mesure) mais devons maintenant choisir des personnalités. 15) Mais, c'est correct, et juste une partie de la grande aventure où nous travaillons vers des interactions véritablement adaptées avec nos assistants LLM.
2,5K