Bytedance только что выпустила перевод голоса в реальном времени, который в 3 раза быстрее, чем раньше, с задержкой всего ~3 секунды! Seed LiveInterp 2 — это модель двусторонней передачи речи в речь с >70% точностью. Когда это появится в видеозвонках, это откроет ранее невозможные связи.
Источник: Пост:
69,14K