¿Vale un píxel mil palabras? DeepSeek-OCR dice que sí. Lo probé con la escritura de médicos, desde la legibilidad en la universidad hasta el caos de los médicos en práctica. Si estamos escalando hacia ventanas de contexto infinitas + inteligencia en tiempo real, podríamos necesitar modelos multimodales más pequeños con compresión eficiente, no simplemente escalar LLMs. Porque tal vez la compresión sea solo inteligencia... Predicción: DeepSeekV4 será un VLM. Este artículo de OCR es el adelanto.