O rany, modele świata spadają jak muchy w tym tygodniu! Dziś również omówimy to na ThursdAI 👏
Hunyuan
Hunyuan14 sie, 11:49
🚀Z radością ogłaszamy, że Hunyuan-GameCraft, framework do generacji interaktywnych filmów wideo o wysokiej dynamice, oparty na HunyuanVideo, jest teraz dostępny jako open-source. Generuje grywalne i fizycznie realistyczne filmy wideo z pojedynczego obrazu sceny oraz sygnałów akcji użytkownika, umożliwiając twórcom i deweloperom "reżyserowanie" gier z perspektywy pierwszej lub trzeciej osoby. Kluczowe zalety: 🔹Wysoka dynamika: Ujednolica standardowe wejścia z klawiatury w wspólną, ciągłą przestrzeń akcji, umożliwiając precyzyjną kontrolę nad prędkością i kątem. To pozwala na eksplorację złożonych trajektorii, pokonując sztywne, ograniczone ruchy tradycyjnych modeli. Może również generować dynamiczne treści środowiskowe, takie jak poruszające się chmury, deszcz, śnieg i przepływ wody. 🔹Długoterminowa spójność: Używa hybrydowego warunku historycznego, aby zachować oryginalne informacje o scenie po znacznym ruchu. 🔹Znacząca redukcja kosztów: Nie ma potrzeby kosztownego modelowania/renderowania. Destylacja PCM kompresuje kroki wnioskowania, zwiększając prędkość i obniżając koszty. To pozwala na uruchomienie skwantyzowanego modelu 13B na konsumenckich GPU, takich jak RTX 4090. Strona projektu: Kod: Raport techniczny: Hugging Face:
1,22K