Fiquei genuinamente impressionado com a facilidade que isso traz para a busca de vídeos. Acho que incorporar quadros completos com modelos multimodais não é o caminho a seguir no momento, e esta é a direção certa. Isso pode mudar no futuro, no entanto! A busca de vídeos ainda é muito incipiente e isso é definitivamente uma inovação.
Inference
Inference19/08, 07:28
Há algo realmente especial no esquema que @grass desenvolveu para o ClipTagger-12B. Uma vez que você começa a pesquisar em grandes conjuntos de dados de vídeo, usar filtros de metadados para objetos, qualidade de produção, logótipos ou ações torna-se absolutamente inestimável. O modelo que treinamos é ótimo, mas esta foi uma verdadeira inovação que eles nos apresentaram.
2,36K