OpenAI の新しい 120B MoE は、M3 Ultra の mlx-lm で適切に動作します。 8ビットクオンツの実行:
38.46K