تم حبس الاستخبارات في حدائق مسورة. اليوم ، نفتح البوابات.
يعمل Parallax الآن في الوضع الهجين ، حيث تخدم أجهزة Mac ووحدات معالجة الرسومات نماذج كبيرة معا في إطار موزع حقا.
يكمن السر وراء أداء Parallax في التحسينات الرئيسية على مستوى الخادم:
- التجميع المستمر: تجميع الطلبات ديناميكيا لزيادة استخدام الأجهزة والإنتاجية إلى أقصى حد.
- مخبأ KV-Cache: يمنع التصميم المستند إلى الكتلة تجزئة الذاكرة ، ويتعامل مع آلاف الطلبات المتزامنة
- العمال غير المتجانسين: الأداء الأمثل عبر وحدات معالجة الرسومات وأجهزة Mac.
صوم. مصدق. موزعة بالكامل.
مقارنة ب Petals (خدمة على غرار BitTorrent) ، حقق Parallax الذي يعمل بتشغيل Qwen2.5-72B على 2× RTX 5090s:
- 3.1× زمن انتقال أقل من طرف إلى طرف ، 5.3× زمن انتقال أسرع بين الرموز
- 2.9× أسرع وقت للرمز المميز الأول ، 3.1× إنتاجية إدخال / إخراج أعلى
كانت النتائج متسقة وأظهرت قابلية توسع كبيرة عبر تكوينات الإدخال المختلفة ، وهذه مجرد البداية.
-530 ألف طلب في 2 أسابيع
-3.3 ألف مدينة عبر 148 منطقة تخدمها 37 ألف عقدة حراسة فقط
-3M اتصالات p2p
-98 مللي ثانية متوسط زمن انتقال P2P
تثبت Lattica كيف يمكن للبنية التحتية خفيفة الوزن من نظير إلى نظير نقل البيانات بسرعة وكفاءة ، مما يدعم التنسيق عبر أي شبكة موزعة.
100 ألف + طلب يخدمها Parallax في 2 أسابيع.
6 قارات ، 50+ لغة. 1 تجربة موزعة بالكامل مدعومة بعدد قليل من وحدات معالجة الرسومات للمستهلكين.
دليل على أن الذكاء يمكن أن يتحرر من صفقات الرقائق المركزية ، ويعمل على الأجهزة المملوكة لك ولنا.
المتابعة التالية: أجهزة Mac
لماذا جمع Gradient Network بقيمة 10 ملايين دولار مهم الذكاء الاصطناعي 🧠 اللامركزية
بدعم من Pantera & Multicoin ، تقوم @Gradient_HQ ببناء بروتوكولات Lattica & Parallax الأساسية لاستدلال الذكاء الاصطناعي الموزع.
هل هذه هي المرحلة التالية من البنية التحتية لنظام الذكاء الاصطناعي؟
تقارير @AnolShaeed
الإعلان عن جولتنا التأسيسية بقيمة 10 ملايين دولار بقيادة @PanteraCapital و @multicoincap ، بمشاركة @hsgcap والشركاء المتميزين وكبار الملائكة عبر الذكاء الاصطناعي والعملات المشفرة.
يغذي هذا الإنجاز مهمتنا المتمثلة في بناء أول وقت تشغيل الذكاء الاصطناعي اللامركزي بالكامل في العالم.
🧵