我的第一篇@delphi_intel帖子是关于生成式 AI 视频模型。摘要如下 (1/10) 👇 s/o 感谢 @moonshot6666 对这篇文章的反馈,以及@PJaccetturo我将无耻地窃取这个兴奋的炒作视频。 TLDR:视频落后于文本 2-3 年。他们变得非常好,非常快
1. 人类是视觉生物。 生成 AI 内容的模式可能会趋向于类似于网络的分布:
2. 市场很大:到 2030 年>40b+ 亿美元(有相关邻接关系)。 营销、娱乐和教育领域的颠覆是显而易见的,但对机器人技术、监控和长期代理任务也有明显的影响
3. 景观有很多跨栈竞争 包括模特公司、多模态应用程序、会说话的头像、口型同步等。更不用说为真正的多模态模型和应用程序提供动力所需的所有基础设施了。 s/o 到地图的@venturetwins和@a16z
4. 东方与西方。 这场竞选在很大程度上在中美之间存在分歧。在视频模型中,中国领先(前 15 个模型中的 9 个) S/O @ArtificialAnlys
6. 大型科技公司优势:将这些新功能输送到 >1b 用户生态系统将带来高投资回报率 基于以下属性,像 $Goog、$meta、$techy、$baba 和字节跳动这样的大型玩家处于有利地位也就不足为奇了。
7. 价值积累: 与此同时,我们看到整个生态系统中存在一些机会——特别是在基础设施和应用程序方面——新进入者可以开辟出大型业务。 (是的,你需要阅读实际报告以获取任何信息,懒惰的家伙)
8. 真实的多模态 今天,视频模型看起来像个玩具。但视频数据和模拟正成为长篇代理任务和启动机器人革命的越来越重要的输入。 视频模型可能正是那点火花。
4.5K