Ollama v0.11.8 は、OpenAI の gpt-oss 20B および 120B モデルで、それをサポートするシステムでデフォルトでフラッシュ アテンションを有効にするようになりました。
32.1K