@grass 为 ClipTagger-12B 开发的架构真的很特别。 一旦你开始搜索庞大的视频数据集,使用元数据过滤器来筛选对象、制作质量、标志或动作就变得非常宝贵。 我们训练的模型很棒,但这是他们带给我们的真正创新。
12.39K