O novo MoE 120B da OpenAI funciona bem em mlx-lm em um M3 Ultra. Executando o quant de 8 bits:
38,44K