Fiquei genuinamente impressionado com a facilidade com que isso facilita a pesquisa de vídeos. Acho que incorporar quadros completos com modelos multimodais não é a jogada no momento, e esse é o caminho. Isso pode mudar no futuro! A pesquisa de vídeo ainda é muito incipiente e isso é definitivamente uma inovação
Inference
Inference19 de ago., 07:28
Há algo realmente especial sobre o esquema que @grass desenvolvido para o ClipTagger-12B. Depois de começar a pesquisar grandes conjuntos de dados de vídeo, o uso de filtros de metadados para objetos, qualidade de produção, logotipos ou ações torna-se absolutamente inestimável. O modelo que treinamos é ótimo, mas essa foi uma inovação real com a qual eles nos procuraram.
2,33K