Gemma 3 270m 4-bit generuje tekst z prędkością ponad 650 (!) tok/sec na M4 Max z mlx-lm i używa < 200MB: Nie przyspieszone:
42,13K