认识 ClipTagger-12b。 这是一个基于 Grass 的真实世界视频数据构建的新视频注释模型,由 @inference_net 在其分布式计算网络上训练和部署。 它以极低的成本提供高准确度的视频标注,并且今天已经上线。 阅读更多:
397.45K