Jag blev genuint imponerad av hur enkelt det är att söka efter video. Jag tror att det inte är rätt väg att gå att bädda in helbilder med multimodala modeller just nu, och det är på det här sättet. Detta kan dock komma att ändras i framtiden! Videosökning är fortfarande i sin linda och detta är definitivt en innovation
Inference
Inference19 aug. 07:28
Det är något riktigt speciellt med schemat som @grass utvecklat för ClipTagger-12B. När du väl börjar söka i massiva videodataset blir det helt ovärderligt att använda metadatafilter för objekt, produktionskvalitet, logotyper eller åtgärder. Modellen vi tränade är fantastisk, men det här var en riktig innovation som de kom till oss med.
2,36K