Nové 120B MoE od OpenAI běží pěkně v mlx-lm na M3 Ultra. Spuštění 8-bitového kvanta:
38,43K