Ollama v0.11.8 agora ativa a atenção flash por padrão nos modelos gpt-oss 20B e 120B da OpenAI para sistemas que a suportam!
32,11K