oLLM: o bibliotecă Python ușoară pentru inferență LLM construită pe transformatoare 🔥 Rulați qwen3-next-80B, GPT-OSS, Llama3, pe hardware de consum. Munca minunată a lui Anuar!