Кэширование KV в LLM, понятное объяснение (с визуалами):
517,12K