OpenAI的新120B MoE在M3 Ultra上的mlx-lm运行良好。 运行8位量化:
38.46K