oLLM: một thư viện Python nhẹ cho suy diễn LLM được xây dựng trên nền tảng transformers 🔥 Chạy qwen3-next-80B, GPT-OSS, Llama3, trên phần cứng tiêu dùng. Công việc tuyệt vời của Anuar!