Gemma 3 270m de 4 bits genera texto a más de 650 (!) tok/seg en un M4 Max con mlx-lm y utiliza < 200MB: No acelerado:
33.23K