Ollama v0.11.8 теперь включает flash attention по умолчанию для моделей OpenAI gpt-oss 20B и 120B на системах, которые это поддерживают!
32,11K