ByteDance Seed và Stanford giới thiệu Mixture of Contexts (MoC) cho việc tạo video dài, giải quyết nút thắt bộ nhớ với một mô-đun định tuyến chú ý thưa mới. Nó cho phép tạo ra các video dài một phút với chi phí như video ngắn.
31,32K