Ollama v0.11.8 aktiverer nå flash-oppmerksomhet som standard på OpenAIs gpt-oss 20B- og 120B-modeller for systemer som støtter det!
32,1K