دراسة الحالة الجديدة الخاصة بنا حول كيفية قيام Sijun Tang (@sijun_tan) من مختبر الحوسبة بجامعة كاليفورنيا في بيركلي سكاي كومبوستينغ لاب وسابقا في @Agentica_ ببناء LLoCO - وهي تقنية تتيح معالجة سياق 128 ألفا مع 30× رمز أقل واستنتاج أسرع 7.62×. مدعوم من وحدات معالجة الرسومات H100 من Hyperbolic Labs.
‏‎1.18‏K