Tôi thực sự ấn tượng với cách mà điều này làm cho việc tìm kiếm video trở nên dễ dàng. Tôi nghĩ rằng việc nhúng các khung hình đầy đủ với các mô hình đa phương thức không phải là hướng đi đúng vào lúc này, và đây chính là cách làm. Tuy nhiên, điều này có thể thay đổi trong tương lai! Tìm kiếm video vẫn còn rất mới mẻ và đây chắc chắn là một sự đổi mới.
Inference
Inference07:28 19 thg 8
Có điều gì đó thật đặc biệt về sơ đồ mà @grass phát triển cho ClipTagger-12B. Khi bạn bắt đầu tìm kiếm trong các tập dữ liệu video khổng lồ, việc sử dụng các bộ lọc siêu dữ liệu cho các đối tượng, chất lượng sản xuất, logo hoặc hành động trở nên vô cùng quý giá. Mô hình mà chúng tôi đã đào tạo rất tuyệt, nhưng đây thực sự là một sự đổi mới mà họ đã đến với chúng tôi.
2,34K