Aplikace Dynamo 0.4 je zde a poskytuje 4x výkon inference na Blackwell s rozloženým podáváním. ⚡️ Mezi nové funkce patří: • Členěné automatické škálování na základě SLO • Nový nástroj pro rozdělené dimenzování • Metriky pozorovatelnosti specifické pro LLM v reálném čase • Odolnost proti chybám, přesměrování požadavků za letu • GB200 NVL72 rozsáhlé odborné paralelní vývojářské příručky Tyto funkce pomáhají AI Factories snižovat náklady na zobrazování inference, konzistentně plnit cíle na úrovni služeb, odstraňovat dohady při nastavování rozčleněných obslužných prostředí a zvyšovat odolnost inferenčního systému. 🔗 Vytváříme aplikaci NVIDIA Dynamo otevřeně a oceňujeme váš příspěvek 👇 Podívejte se na naše úložiště na GitHubu a připojte se ke komunitě ➡️ NVIDIA Dynamo
1,14K