O Ollama v0.11.8 agora permite a atenção do flash por padrão nos modelos gpt-oss 20B e 120B da OpenAI para sistemas que o suportam!
32,12K