DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Dynamo 0.4 is hier en levert 4x inferentieprestaties op Blackwell met gedisaggregeerde service. ⚡️ Nieuwe functies zijn onder andere: • SLO-gebaseerde gedisaggregeerde autoscaling • Nieuwe gedisaggregeerde sizing tool • Real-time LLM specifieke observabiliteitsmetrics • Fouttolerantie inflight verzoek rerouting • GB200 NVL72 grootschalige expert parallel ontwikkelaarsgidsen Deze functies helpen AI-fabrieken om de kosten van inferentie service te verlagen, consistent te voldoen aan service level doelstellingen, het giswerk voor het opzetten van gedisaggregeerde serviceomgevingen te verwijderen en de veerkracht van het inferentiesysteem te verbeteren. 🔗 We bouwen NVIDIA Dynamo in de open en waarderen uw bijdrage 👇 Bekijk onze repo op GitHub en sluit je aan bij de NVIDIA Dynamo gemeenschap ➡️

1,19K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste