介绍 ClipTagger-12b。 这是一个最先进的视频注释模型,与 @grass 合作训练。 ClipTagger-12b 提供与 Claude 4 和 GPT-4.1 相媲美的视频注释能力,成本低17倍。 了解更多:
24.05K