Ollama v0.11.8 active désormais l'attention flash par défaut sur les modèles gpt-oss 20B et 120B d'OpenAI pour les systèmes qui le supportent !
32,1K