OpenAI's nieuwe 120B MoE draait mooi in mlx-lm op een M3 Ultra. Het draaien van de 8-bit quant:
38,47K