我們訓練這個模型以改變幀字幕、標註和視頻搜索的單位經濟學。 處理10億幀的成本曾經高達數百萬,但現在對於那些不是最大公司的團隊來說是可行的。 我們看到這將解鎖PB級別的視頻庫,這些庫之前無法搜索、分類或提取片段。 我們已經與@grass合作在互聯網規模上部署了這個模型。 如果你有這個模型的使用案例,請給我們發私信。我們行動非常迅速。
Inference
Inference8月15日 02:02
介紹 ClipTagger-12b。 這是一個最先進的視頻註釋模型,與 @grass 合作訓練。 ClipTagger-12b 提供與 Claude 4 和 GPT-4.1 相媲美的視頻註釋能力,成本低17倍。 了解更多:
4.4K