¡Emocionado de compartir nuestro nuevo trabajo: StreamingVLM! 🚀 Abordamos un gran desafío para los Modelos de Visión-Lenguaje (VLMs): entender flujos de video infinitos en tiempo real sin que la latencia se dispare o sin quedarnos sin memoria. Documento: Código: