Le nouveau MoE de 120B d'OpenAI fonctionne bien dans mlx-lm sur un M3 Ultra. Exécution du quant 8 bits :
38,44K