OpenAIs neues 120B MoE läuft gut in mlx-lm auf einem M3 Ultra. Ausführen der 8-Bit-Quantisierung:
38,46K