Ollama v0.11.8 ora abilita l'attenzione flash per impostazione predefinita sui modelli gpt-oss 20B e 120B di OpenAI per i sistemi che lo supportano!
32,09K