MoE 120B baru OpenAI berjalan dengan baik di mlx-lm pada M3 Ultra. Menjalankan kuantitas 8-bit:
38,46K