Gemma 3 270m 4-bit gera texto a mais de 650 (!) tok/s em um M4 Max com mlx-lm e usa < 200MB: Não acelerado:
57,47K