Alcuni pensieri estesi su GPT-5 1) GPT-5 è un buon modello. Sembra fornire una ricerca e prestazioni migliori rispetto a o3 prima di esso. 2) È deludente per le persone perché è un miglioramento incrementale, che non apre a casi d'uso fondamentalmente nuovi. 3) La storia davvero interessante attorno a GPT-5 sembra riguardare più la competizione con Anthropic. 4) Anthropic ha aumentato il suo fatturato di 4-5 volte negli ultimi 6 mesi. OpenAI ha aumentato il suo fatturato di 2 volte. 5) Gran parte della crescita del fatturato di Anthropic è dovuta ai ricavi API, che rappresentano una percentuale molto più alta del fatturato di Anthropic (60%) rispetto a quello di OpenAI (25%). 6) Circa il 50% dei ricavi API di Anthropic proviene dai suoi partner Cursor e Github Copilot. Anthropic probabilmente raccoglie qualcosa come 800 milioni di dollari di fatturato da Cursor. 7) GPT-5 sembra essere in parte un modo per sfidare il dominio di Anthropic negli agenti di codifica. GPT-5 è ora il predefinito in Cursor. 8) GPT-5 finalmente eguaglia le prestazioni di Claude 4.1 Opus su SWE Bench Verified, che non è una misura perfetta ma sembra essere un buon proxy per le prestazioni. 9) La partnership con Cursor ha l'opportunità di deviare molti ricavi da Anthropic, mentre aiuta OpenAI a consolidare la sua quota di mercato nella mente dei consumatori per le applicazioni di codifica. 10) Non ci leggerei troppo, ma potrebbe rallentare la crescita del fatturato di Anthropic e rendere marginalmente più difficile per loro raccogliere fondi (anche se probabilmente è un effetto debole). 11) Ho altri pensieri su GPT-5 da una prospettiva di interazione con l'utente / lancio. 12) Penso che abbiano rovinato il lancio; nessuno vuole guardare dirette, i benchmark non sono più intelligibili e non c'era nulla di virale con cui interagire. 13) Le interazioni con i modelli interessanti devono riguardare nuove modalità o devono essere molto agentiche, il che richiede molta impalcatura. Anche le cose storiche mondiali sono buone - i nostri modelli hanno risolto un premio millenario. 14) I laboratori tendono a risolvere UI/UX in un posto e poi si ritrovano con problemi in un altro; semplifichiamo la complessità del modello (in parte) ma ora dobbiamo scegliere le personalità. 15) Ma va bene, ed è solo parte della grande avventura in cui lavoriamo verso interazioni veramente personalizzate con i nostri assistenti LLM.
2,33K