Ollama v0.11.8 permite acum atenția flash în mod implicit pe modelele gpt-oss 20B și 120B de la OpenAI pentru sistemele care îl acceptă!
32,1K