berte jednu DeepSeek knihovnu po druhé, zvyšujete je o 20 %–30 % rychleji, optimalizujete je pro B200 a CuTeDSL