ByteDance Seed і Stanford представляють технологію Mix of Contexts (MoC) для тривалої генерації відео, вирішуючи проблему вузького місця в пам'яті за допомогою нового модуля маршрутизації розрідженої уваги. Це дозволяє створювати стабільні відео тривалістю в хвилини з вартістю короткого відео.
31,31K