Ollama v0.11.8 möjliggör nu flash-uppmärksamhet som standard på OpenAI:s gpt-oss 20B- och 120B-modeller för system som stöder det!
32,1K