Huawei openPangu-Ultra-MoE-718B-model Geen Nvidia-technologie gebruikt om dit model te bouwen - alleen Ascend AI-chips, CANN en geen CUDA. "... getraind vanaf nul op Ascend NPU, met een totaal aantal parameters van 718B en 39B geactiveerde parameters per token. De openPangu-Ultra-MoE-718B is getraind op ongeveer 19 biljoen tokens en is uitgerust met de mogelijkheid om te schakelen tussen snel en langzaam denken." Lijkt een state-of-the-art model te zijn, zo niet het beste open model dat momenteel beschikbaar is. Link hieronder - je kunt het downloaden en gebruiken.
26,53K