El nuevo MoE 120B de OpenAI funciona muy bien en mlx-lm en un M3 Ultra. Ejecución del cuanto de 8 bits:
38.44K