Entrenamos este modelo para invertir la economía unitaria de los subtítulos de fotogramas, el etiquetado y la búsqueda de videos. El procesamiento de fotogramas 1B solía costar del orden de millones, pero ahora es viable para equipos que no son las empresas más grandes. Vemos esto desbloqueando bibliotecas de video a escala de petabytes+, que antes eran imposibles de buscar, categorizar o extraer clips. Ya hemos implementado este modelo a escala de Internet en asociación con @grass. Si tienes un caso de uso para esta sesión de modelos, usa un dm. Nos movemos extremadamente rápido.
Inference
Inference15 ago, 02:02
Presentamos ClipTagger-12b. Un modelo de anotación de video de última generación entrenado en colaboración con @grass. ClipTagger-12b ofrece capacidades de anotación de video a la par con Claude 4 y GPT-4.1 a un costo 17 veces menor. Aprende más:
4.4K