Wytrenujemy ten model, aby zmienić ekonomię jednostkową w zakresie podpisów do ramek, etykietowania i wyszukiwania wideo. Przetwarzanie 1 miliarda klatek wcześniej kosztowało miliony, ale teraz jest wykonalne dla zespołów, które nie są największymi firmami. Widocznie otwiera to biblioteki wideo o skali petabajtów+, które wcześniej były niemożliwe do przeszukiwania, kategoryzowania lub wyodrębniania klipów. Już wdrożyliśmy ten model na skalę internetową we współpracy z @grass. Jeśli masz przypadek użycia dla tego modelu, napisz do nas w wiadomości prywatnej. Działamy niezwykle szybko.
Inference
Inference15 sie, 02:02
Przedstawiamy ClipTagger-12b. To nowoczesny model adnotacji wideo, wytrenowany we współpracy z @grass. ClipTagger-12b oferuje możliwości adnotacji wideo na poziomie porównywalnym z Claude 4 i GPT-4.1 przy 17-krotnie niższych kosztach. Dowiedz się więcej:
3,54K