На GitHub найден открытый проект: Memvid, который революционизирует традиционный подход к обработке векторных баз данных, напрямую кодируя текстовые данные в видеофайлы. Сжимая миллионы текстовых блоков в один MP4 файл, он не только достигает 10-кратного коэффициента сжатия, но и выполняет семантический поиск за доли секунды, полностью обходясь без серверов баз данных. GitHub: Кроме того, встроена функция диалога, позволяющая вести контекстуально осознанные беседы с базой знаний, а также поддерживается прямой импорт PDF-документов с автоматической индексацией. Может полностью работать в оффлайн-режиме, после генерации видео не требуется подключение к сети. AI-разработчикам, создающим крупные базы знаний, стоит обратить внимание на этот проект.
54,42K