GB200 MAMF-benchmarks er inne. NVIDIA-effektiviteten fortsetter å gå ned.
GB200 er mindre effektiv enn B200: 72.9 vs 77.6% for bf16 - jeg prøvde både cuda-12.9 og 13.0 - omtrent de samme resultatene.
Vær forsiktig når du legger planer basert på teoretiske TFLOPS