Aufgeregt, unsere neue Arbeit zu teilen: StreamingVLM! 🚀 Wir nehmen eine große Herausforderung für Vision-Language-Modelle (VLMs) an: das Verständnis unendlicher Video-Streams in Echtzeit, ohne dass die Latenz explodiert oder der Speicher ausgeht. Papier: Code: