Dynamo 0.4 is hier en levert 4x inferentieprestaties op Blackwell met gedisaggregeerde service. ⚡️ Nieuwe functies zijn onder andere: • SLO-gebaseerde gedisaggregeerde autoscaling • Nieuwe gedisaggregeerde sizing tool • Real-time LLM specifieke observabiliteitsmetrics • Fouttolerantie inflight verzoek rerouting • GB200 NVL72 grootschalige expert parallel ontwikkelaarsgidsen Deze functies helpen AI-fabrieken om de kosten van inferentie service te verlagen, consistent te voldoen aan service level doelstellingen, het giswerk voor het opzetten van gedisaggregeerde serviceomgevingen te verwijderen en de veerkracht van het inferentiesysteem te verbeteren. 🔗 We bouwen NVIDIA Dynamo in de open en waarderen uw bijdrage 👇 Bekijk onze repo op GitHub en sluit je aan bij de NVIDIA Dynamo gemeenschap ➡️
1,19K