أنا مندهش باستمرار من قلة التطبيقات التي تستفيد من حقيقة أن أنظمة الذكاء الاصطناعي يمكنها العمل مع الفيديو. على سبيل المثال ، يمكنني طرح أسئلة على الجوزاء حول ما يحدث في مقطع فيديو (ولم يتم ذكره في النص) والحصول على إجابات متماسكة بما في ذلك تحديد المشاعر