热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于GPT-5的一些扩展思考
1) GPT-5是一个不错的模型。它似乎提供了比之前的o3更好的搜索和性能。
2) 这让人失望,因为它只是一个渐进式的改进,并没有开启根本新的用例。
3) 关于GPT-5,真正有趣的故事似乎更多是关于与Anthropic的竞争。
4) 在过去的6个月里,Anthropic的收入增长了4-5倍。OpenAI的收入增长了2倍。
5) Anthropic收入增长的很大一部分来自API收入,这在Anthropic的收入中占了更大的比例(60%),而OpenAI的收入中仅占25%。
6) 大约50%的Anthropic API收入来自其Cursor和Github Copilot合作伙伴。Anthropic可能从Cursor中收集了大约8亿美元的收入。
7) GPT-5在某种程度上是为了挑战Anthropic在编码代理方面的主导地位。GPT-5现在是Cursor的默认选项。
8) GPT-5终于在SWE Bench Verified上与Claude 4.1 Opus的表现相匹配,虽然这不是一个完美的衡量标准,但似乎是一个不错的性能代理。
9) Cursor合作伙伴关系有机会将大量收入从Anthropic转移,同时帮助OpenAI巩固其在编码应用中的消费者心智份额。
10) 我不会过于解读这一点,但这可能会减缓Anthropic的收入增长,并使他们融资变得稍微困难(尽管可能是微弱的影响)。
11) 我还有关于GPT-5的其他想法,从用户互动/发布的角度来看。
12) 我认为他们搞砸了发布;没有人想看直播,基准测试变得不再易懂,而且没有什么病毒式的互动内容。
13) 酷炫的模型互动需要关于新模式,或者需要非常具代理性,这需要大量的支撑。世界历史性的成就也很好 - 我们的模型解决了千年奖。
14) 实验室往往在一个地方解决UI/UX问题,然后在另一个地方又出现问题;我们简化了模型复杂性(在某种程度上),但现在必须选择个性。
15) 但这没关系,这只是我们朝着与我们的LLM助手实现真正量身定制的互动而努力的伟大冒险的一部分。
2.5K
热门
排行
收藏