Я був щиро вражений тим, наскільки легко це робить пошук відео. Я думаю, що вбудовування повних кадрів у мультимодальні моделі – це не хід на даний момент, і це шлях. Однак у майбутньому це може змінитися! Пошук по відео все ще тільки зароджується, і це однозначно нововведення
Inference
Inference19 серп., 07:28
Є щось дійсно особливе в схемі, яку @grass розробив для ClipTagger-12B. Як тільки ви почнете шукати величезні набори відеоданих, використання фільтрів метаданих для об'єктів, якості виробництва, логотипів або дій стане абсолютно безцінним. Модель, яку ми тренували, чудова, але це була справжня інновація, з якою до нас прийшли.
2,33K