Dynamo 0.4 è qui e offre prestazioni di inferenza 4 volte superiori su Blackwell con un servizio disaggregato. ⚡️ Le nuove funzionalità includono: • Autoscaling disaggregato basato su SLO • Nuovo strumento di dimensionamento disaggregato • Metriche di osservabilità specifiche per LLM in tempo reale • Tolleranza ai guasti con reindirizzamento delle richieste in volo • Guide per sviluppatori esperti in parallelo su larga scala GB200 NVL72 Queste funzionalità aiutano le AI Factory a ridurre i costi di servizio di inferenza, a soddisfare costantemente gli obiettivi di livello di servizio, a rimuovere le congetture per la configurazione degli ambienti di servizio disaggregato e a migliorare la resilienza del sistema di inferenza. 🔗 Stiamo costruendo NVIDIA Dynamo in modo aperto e apprezziamo il tuo contributo 👇 Dai un'occhiata al nostro repository su GitHub e unisciti alla comunità NVIDIA Dynamo ➡️
1,15K