很高兴分享我们的新工作:StreamingVLM! 🚀 我们解决了视觉-语言模型(VLMs)面临的一个重大挑战:实时理解无限视频流,而不会出现延迟过高或内存不足的问题。 论文: 代码: