Ollama v0.11.8 ahora habilita la atención flash de forma predeterminada en los modelos gpt-oss 20B y 120B de OpenAI para los sistemas que lo admiten.
32.11K