关于GPT-5的一些扩展思考 1) GPT-5是一个不错的模型。它似乎提供了比之前的o3更好的搜索和性能。 2) 这让人失望,因为它只是一个渐进式的改进,并没有开启根本新的用例。 3) 关于GPT-5,真正有趣的故事似乎更多是关于与Anthropic的竞争。 4) 在过去的6个月里,Anthropic的收入增长了4-5倍。OpenAI的收入增长了2倍。 5) Anthropic收入增长的很大一部分来自API收入,这在Anthropic的收入中占了更大的比例(60%),而OpenAI的收入中仅占25%。 6) 大约50%的Anthropic API收入来自其Cursor和Github Copilot合作伙伴。Anthropic可能从Cursor中收集了大约8亿美元的收入。 7) GPT-5在某种程度上是为了挑战Anthropic在编码代理方面的主导地位。GPT-5现在是Cursor的默认选项。 8) GPT-5终于在SWE Bench Verified上与Claude 4.1 Opus的表现相匹配,虽然这不是一个完美的衡量标准,但似乎是一个不错的性能代理。 9) Cursor合作伙伴关系有机会将大量收入从Anthropic转移,同时帮助OpenAI巩固其在编码应用中的消费者心智份额。 10) 我不会过于解读这一点,但这可能会减缓Anthropic的收入增长,并使他们融资变得稍微困难(尽管可能是微弱的影响)。 11) 我还有关于GPT-5的其他想法,从用户互动/发布的角度来看。 12) 我认为他们搞砸了发布;没有人想看直播,基准测试变得不再易懂,而且没有什么病毒式的互动内容。 13) 酷炫的模型互动需要关于新模式,或者需要非常具代理性,这需要大量的支撑。世界历史性的成就也很好 - 我们的模型解决了千年奖。 14) 实验室往往在一个地方解决UI/UX问题,然后在另一个地方又出现问题;我们简化了模型复杂性(在某种程度上),但现在必须选择个性。 15) 但这没关系,这只是我们朝着与我们的LLM助手实现真正量身定制的互动而努力的伟大冒险的一部分。
2.5K