ByteDance Seed und Stanford stellen Mixture of Contexts (MoC) für die Generierung von langen Videos vor, um das Speicherengpassproblem mit einem neuartigen sparsamen Aufmerksamkeitsrouting-Modul zu lösen. Es ermöglicht konsistente Videos von einer Minute Länge zu den Kosten von Kurzvideos.
31,31K