Huawei openPangu-Ultra-MoE-718B-model Nessuna tecnologia Nvidia utilizzata per costruire questo modello - solo chip AI Ascend, CANN non CUDA. "... addestrato da zero su Ascend NPU, con un totale di 718 miliardi di parametri e 39 miliardi di parametri attivati per token. L'openPangu-Ultra-MoE-718B è stato addestrato su circa 19 trilioni di token ed è dotato della capacità di passare tra pensiero veloce e lento." Sembra essere un modello all'avanguardia, se non il migliore modello open attualmente disponibile. Link qui sotto - puoi scaricarlo e usarlo.
26,53K