Tbh saya tidak bisa mengimbangi lagi ... Ini sepertinya SOTA, tidak dilatih di Nvidia
steve hsu
steve hsu4 Agu, 22.27
Huawei terbukaPangu-Ultra-MoE-718B-model Tidak ada teknologi Nvidia yang digunakan untuk membangun model ini - hanya chip Ascend AI, CANN bukan CUDA. "... dilatih dari awal di Ascend NPU, dengan jumlah total parameter 718B dan 39B parameter yang diaktifkan per token. OpenPangu-Ultra-MoE-718B dilatih pada sekitar 19 triliun token, dan dilengkapi dengan kemampuan untuk beralih antara pemikiran cepat dan lambat." Tampaknya menjadi model canggih jika bukan model terbuka terbaik yang tersedia saat ini. Tautan di bawah ini - Anda dapat mengunduhnya dan menggunakannya
2,73K