oLLM:一个轻量级的 Python 库,用于基于 transformers 的 LLM 推理 🔥 在消费级硬件上运行 qwen3-next-80B、GPT-OSS、Llama3。Anuar 的精彩工作!