Ollama v0.11.8 aktiviert jetzt standardmäßig Flash Attention für die 20B- und 120B-Modelle von OpenAI's gpt-oss auf Systemen, die dies unterstützen!
32,1K