Um pixel vale mais que mil palavras? DeepSeek-OCR diz que sim. Eu testei na caligrafia do médico, desde a legibilidade da faculdade até o caos do médico praticante. Se estivermos escalando para janelas de contexto infinitas + inteligência em tempo real, podemos precisar de modelos multimodais menores com compactação eficiente, não simplesmente dimensionando LLMs. Porque talvez a compressão seja apenas inteligência... Previsão: DeepSeekV4 será um VLM. Este artigo OCR é o teaser.