ByteDance Seed a Stanford představují Mix of Contexts (MoC) pro generování dlouhého videa, který řeší úzké hrdlo paměti pomocí nového modulu řídkého směrování pozornosti. Umožňuje minutová konzistentní videa s cenou za krátké video.
31,31K