Новая 120B MoE от OpenAI хорошо работает в mlx-lm на M3 Ultra. Запуск 8-битного кванта:
38,47K