Ollama v0.11.8 teraz domyślnie włącza flash attention w modelach OpenAI gpt-oss 20B i 120B dla systemów, które to wspierają!
32,09K