Ich war wirklich beeindruckt, wie einfach das die Videosuche macht. Ich denke, dass das Einbetten von Vollbildern mit multimodalen Modellen im Moment nicht der richtige Weg ist, und das hier ist der richtige Ansatz. Das könnte sich in Zukunft jedoch ändern! Die Videosuche ist noch sehr neu und das ist definitiv eine Innovation.
Inference
Inference19. Aug., 07:28
Es gibt etwas wirklich Besonderes an dem Schema, das @grass für ClipTagger-12B entwickelt hat. Sobald Sie beginnen, massive Videodatenmengen zu durchsuchen, wird die Verwendung von Metadatenfiltern für Objekte, Produktionsqualität, Logos oder Aktionen absolut unverzichtbar. Das Modell, das wir trainiert haben, ist großartig, aber das war eine echte Innovation, mit der sie zu uns gekommen sind.
2,33K