دراسة الحالة الجديدة الخاصة بنا حول كيفية قيام Sijun Tan (@sijun_tan) من مختبر الحوسبة بجامعة كاليفورنيا في بيركلي سكاي كومبوتينج Lab وسابقا ببناء LLoCO @Agentica_ - وهي تقنية تتيح معالجة سياق 128 ألفا مع 30× رمز أقل واستنتاج أسرع 7.62×. مدعوم من وحدات معالجة الرسومات H100 من Hyperbolic Labs.
‏‎1.95‏K