Модель Huawei openPangu-Ultra-MoE-718B Для створення цієї моделі не використовувалася технологія Nvidia - тільки чіпи Ascend AI, CANN, а не CUDA. "... навчання з нуля на Ascend NPU, із загальною кількістю параметрів 718B та 39B активованими параметрами на токен. openPangu-Ultra-MoE-718B навчений приблизно на 19 трильйонах токенів і оснащений можливістю перемикатися між швидким і повільним мисленням». Здається, це найсучасніша модель, якщо не найкраща відкрита модель, доступна на даний момент. Посилання нижче - ви можете завантажити його та використовувати
26,54K