ByteDance Seed och Stanford introducerar Mixture of Contexts (MoC) för generering av lång video och tar itu med flaskhalsen i minnet med en ny gles modul för uppmärksamhetsdirigering. Det möjliggör minutlånga konsekventa videor med korta videokostnader.
31,32K