المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

CodecFlow
طبقة التنفيذ لمشغلي الذكاء الاصطناعي والروبوتات على @Solana
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
لا تزال VLAs جديدة جدا ويجد الكثير من الناس صعوبة في فهم الفرق بين VLAs و LLMs.
فيما يلي نظرة عميقة على كيفية اختلاف أنظمة الذكاء الاصطناعي هذه في التفكير والاستشعار والعمل. الجزء 1.
دعنا نقسم الفروق الرئيسية وكيف تختلف عوامل الذكاء الاصطناعي الملفوفة حول LLM عن وكلاء المشغل الذين يستخدمون نماذج VLA:
1. الإحساس: كيف ينظرون إلى العالم
الوكيل (LLM): يعالج النصوص أو البيانات المنظمة، مثل JSON وواجهات برمجة التطبيقات وأحيانا الصور. إنه مثل الدماغ الذي يعمل بمدخلات نظيفة ومجردة. فكر في قراءة دليل أو تحليل جدول بيانات. رائع للبيئات المنظمة ولكنه مقيد بما يتم تغذيته به.
المشغل (VLA): يشاهد وحدات البكسل الأولية في الوقت الفعلي من الكاميرات، بالإضافة إلى بيانات المستشعر (مثل اللمس والموضع) واستقبال الحس العميق (الوعي الذاتي بالحركة). إنه مثل التنقل في العالم بالعيون والحواس ، والازدهار في الإعدادات الديناميكية والفوضوية مثل واجهات المستخدم أو المساحات المادية.
2. التصرف: كيف يتفاعلون
الوكيل: يعمل عن طريق استدعاء الوظائف أو الأدوات أو واجهات برمجة التطبيقات. تخيل ذلك كمدير يرسل تعليمات دقيقة مثل "حجز رحلة عبر Expedia API". إنه متعمد ولكنه يعتمد على أدوات مسبقة الصنع وواجهات واضحة.
المشغل: ينفذ إجراءات مستمرة منخفضة المستوى، مثل تحريك مؤشر الماوس أو الكتابة أو التحكم في مفاصل الروبوت. إنه مثل العامل الماهر الذي يتلاعب بالبيئة بشكل مباشر ، وهو مثالي للمهام التي تتطلب دقة في الوقت الفعلي.
3. السيطرة: كيف يتخذون القرارات
الوكيل: يتبع حلقة بطيئة وعاكسة: التخطيط ، استدعاء أداة ، تقييم النتيجة ، التكرار. إنه مرتبط بالرمز المميز (مقيد بمعالجة النص) ومرتبط بالشبكة (في انتظار استجابات واجهة برمجة التطبيقات). هذا يجعلها منهجية ولكنها بطيئة للمهام في الوقت الفعلي.
المشغل: يعمل ، ويتخذ قرارات تدريجية في حلقة تغذية مرتدة ضيقة. فكر في الأمر كلاعب يتفاعل على الفور مع ما يظهر على الشاشة. تتيح هذه السرعة تفاعلا سلسا ولكنها تتطلب معالجة قوية في الوقت الفعلي.
4. البيانات للتعلم: ما الذي يغذي تدريبهم
الوكيل: مدرب على مجموعات نصية واسعة أو تعليمات أو وثائق أو مجموعات بيانات RAG (Retrieval-Augmented Generation). يتعلم من الكتب أو التعليمات البرمجية أو الأسئلة الشائعة ، ويتفوق في التفكير على المعرفة المنظمة.
المشغل: يتعلم من العروض التوضيحية (على سبيل المثال، مقاطع فيديو لبشر يؤدون المهام) أو سجلات التشغيل عن بعد أو إشارات المكافأة. إنه مثل التعلم من خلال المشاهدة والممارسة ، وهو مثالي للمهام التي تكون فيها التعليمات الصريحة نادرة.
5. أوضاع الفشل: حيث تنكسر
الوكيل: عرضة للهلوسة (اختلاق الإجابات) أو خطط الأفق الطويل الهشة التي تنهار إذا فشلت خطوة واحدة. إنه مثل الخبير الاستراتيجي الذي يبالغ في التفكير أو يسيء قراءة الموقف.
المشغل: يواجه تحولا متغيرا (عندما لا تتطابق بيانات التدريب مع ظروف العالم الحقيقي) أو أخطاء مركبة في التحكم (أخطاء صغيرة كرة ثلج). إنه مثل سائق يفقد السيطرة على طريق غير مألوف.
6. Infra: التكنولوجيا التي تقف وراءهم
الوكيل: يعتمد على موجه/موجه لتحديد الأدوات التي يجب استدعاؤها، وسجل أداة للوظائف المتاحة، والذاكرة/RAG للسياق. إنه إعداد معياري ، مثل مركز القيادة الذي ينسق المهام.
المشغل: يحتاج إلى خطوط أنابيب استيعاب الفيديو ، وخادم إجراءات للتحكم في الوقت الفعلي ، ودرع أمان لمنع الإجراءات الضارة ، ومخزن مؤقت لإعادة التشغيل لتخزين التجارب. إنه نظام عالي الأداء مصمم للبيئات الديناميكية.
7. حيث يضيء كل منهما: بقعهم الحلوة
الوكيل: يهيمن على مهام سير العمل باستخدام واجهات برمجة التطبيقات النظيفة (على سبيل المثال، أتمتة العمليات التجارية)، أو التفكير في المستندات (على سبيل المثال، تلخيص التقارير)، أو إنشاء التعليمات البرمجية. إنه خيارك المفضل للمهام المنظمة عالية المستوى.
المشغل: يتفوق في البيئات الفوضوية الخالية من واجهة برمجة التطبيقات مثل التنقل في واجهات المستخدم عالية الكعب أو التحكم في الروبوتات أو التعامل مع المهام الشبيهة باللعبة. إذا كان ينطوي على تفاعل في الوقت الفعلي مع أنظمة غير متوقعة ، فإن VLA هي الملك.
8. النموذج العقلي: مخطط + فاعل
فكر في وكيل LLM على أنه المخطط: فهو يقسم المهام المعقدة إلى أهداف واضحة ومنطقية.
مشغل VLA هو الفاعل ، وينفذ هذه الأهداف من خلال التفاعل المباشر مع وحدات البكسل أو الأنظمة المادية. يراقب المدقق (نظام أو وكيل آخر) النتائج لضمان النجاح.
$CODEC

18.3K
يقدم Codecflow Optr نهجا موحدا لبناء الوكلاء الذين يرون ويسببون ويتصرفون في البيئات الرقمية والمادية. سواء كان ذلك أتمتة سير عمل سطح المكتب ، أو التحكم في أذرع الروبوت ، أو الاختبار في المحاكاة ، فإنه يستخدم نفس النموذج العقلي والبدائيات.

Louround 🥂21 أغسطس، 04:10
من المفترض أن يتم شراء الانخفاضات في السوق الصاعدة ، خاصة في المشاريع ذات المحفزات الكبيرة
نعلم جميعا أن الذكاء الاصطناعي هو سرد هذه الدورة ، التي بدأتها ai16z و Virtuals العام الماضي.
رهاني هو أن السوق سيركز على تقنيات أكثر تعقيدا وتطورا مثل VLAs ، واسمحوا لي أن أخبرك بالسبب.
تقرأ LLMs (نماذج اللغة الكبيرة) النص ويكتبه بشكل أساسي: فهي رائعة في شرح التعليمات والتخطيط وإنشائها ، لكنها لا تتحكم في المحركات أو تتفاعل مع العالم المادي (كما قد تكون قد جربت مع chatgpt).
تختلف VLAs (نماذج عمل لغة الرؤية) عن LLMs لأنها أنظمة متعددة الوسائط تنظر إلى الأشياء (الرؤية) وتفهم التعليمات (اللغة) وتنتج الإجراءات مباشرة. إنه مثل إخبار الروبوت بالتقاط كوب أحمر ثم تحريك ذراعه للقيام بذلك.
يتم تدريب VLAs على الأمثلة التي تقرن الصور / الفيديو + التعليمات + آثار العمل الحقيقية (كيف يتحرك الروبوت بالفعل) ، ويجب أن تعمل بسرعة وأمان في الوقت الفعلي. يتم تدريب LLMs من جانبهم على مجموعات نصوص ضخمة ويركزون على التفكير ومهام اللغة.
TL. يفكر دكتور في القانون ويتحدث بينما يرى VLAs ويفكر ويتصرف.
كما ترى ، تعد VLAs إضافة رئيسية إلى LLMs وستمكن بشكل خاص من 0 إلى 1 الابتكار التالي في الاقتصاد العام الذي سيكون الروبوتات. تخصص غالبية صناديق الاستثمار جزءا كبيرا من استثماراتها في هذا القطاع ، والذي ينظر إليه على أنه التطور المنطقي التالي في صناعة الذكاء الاصطناعي.
لقد قمت بالفعل بنشر منشور منذ فترة على الشركة الرائدة الحالية في سوق العملات المشفرة ، @codecopenflow ، التي لم تجمع رأس المال (الإطلاق العادل) ولكنها تشحن منتجات متطورة وتبلغ حاليا 23 مليون دولار FDV.
للحصول على معلومات ، جمع منافسون آخرون للعملات المشفرة 20 مليون دولار (@openmind_agi) بما قد يكون 200 مليون دولار إلى 300 مليون دولار ++ FDV بينما لم يتم بناء أي منتج أو مجتمع وشحنه حتى الآن.
ما يجعل Codec مشروعا رائدا في هذا القطاع هو أنها تعالج عنق الزجاجة الحاسم في الروبوتات الذكاء الاصطناعي ، وهي صعوبة تفاعل جميع الأدوات الذكاء الاصطناعي معا. اسمحوا لي أن أشرح.
أحدث إصدار لها ، OPTR (المشغل) ، هو مجموعة أدوات تساعد في بناء مشغلين قادرين على التفاعل على منصات متعددة مثل الروبوتات أو أجهزة الكمبيوتر المكتبية أو المتصفحات أو عمليات المحاكاة. الهدف من المشغل هو رؤية والتفكير والتصرف (VLA) في كل من العالم الرقمي (أجهزة الكمبيوتر) والمادية (الروبوتات).
تعمل مجموعة الأدوات هذه كبنية تحتية أساسية للفرق الروبوتية التي تهدف إلى اختبار منتجاتها وتعزيز العملية الشاملة من خلال توفير تجربة موحدة بدلا من تجربة منفصلة لمتصفحات الويب أو المحاكاة أو الروبوتات. هذا يجعل المشغل بشكل أساسي متكيفا ومستقلا بغض النظر عن بيئته.
حتى تحصل عليه ، سيوفر وقتا كبيرا للشركات والمطورين الذين كان عليهم سابقا متابعة كل خطوة يدويا وحيث يمكنك توفير الوقت الذي يمكنك فيه توفير المال.
كما سيمكن Codec من بناء مشاريع المشغلين الخاصة بها وإطلاق قدرات جديدة بسرعة نسبيا في السوق ، لا سيما من خلال أسواقها.
TL. دكتور: ربما تكون قد شاهدت مقاطع فيديو للروبوتات وهي تطوي الأنسجة أو صناديق الفرز أو تقفز على عناصر مختلفة. لقد تم تدريبهم جميعا على حالة الاستخدام المحددة للغاية هذه ، ولسوء الحظ ، لا يمكن إعادة استخدام مهارة واحدة في بيئة أخرى كما يمكن للإنسان. يحل OPTR من Codec هذا من خلال جعل المهارات قابلة للنقل بين البيئات والمواقف ، مما يجعل التدريب والتطوير أسرع وأرخص بكثير للمؤسسات.
هذا هو السبب في أن برنامج الترميز مثير للاهتمام في توحيد العالم الرقمي مع العالم المادي.
$CODEC ، مشفر.

2.26K
نشرت شركة الأبحاث @epochbiz (بواسطة @ZoomerOracle) مقالا بحثيا مفصلا عن CodecFlow.
لا تفوتها.
$CODEC

epoch_19 أغسطس، 21:07
يتم إعداد $CODEC ليكون الخيار الأفضل كلعب على السلسلة للروبوتات
مقال بحثي حول @codecopenflow متاح 🤖 الآن

3.52K
نشهد ارتفاعا في الحسابات المزيفة التي تدعي أنها تمثل CodecFlow.
X / Twitter الرسمي الوحيد هو @codecopenflow و @RoboMove.
جميع القنوات الأخرى التي تم التحقق منها مدرجة على موقعنا الإلكتروني.
لا يوجد سوى رمز واحد ، $CODEC.
ابق يقظا وأبلغ عن أي حسابات مشبوهة.
يرجى إعادة النشر والمشاركة للمساعدة في نشر الكلمة.

3.21K
RoboMove هو عرض مدعوم بالكامل من البنية التحتية ل CodecFlow.
لا يوجد رمز منفصل. $CODEC هو الرمز الوحيد داخل النظام البيئي.
@RoboMove مجرد مثال واحد على ما هو ممكن مع مشغلي CodecFlow.
قريبا ، سيتمكن المطورون من بناء أنظمتهم المتقدمة على CodecFlow باستخدام SDK والأدوات الخاصة بنا.
النظام الأساسي مفتوح وقابل للتوسيع عن قصد ، مما يسمح بحالات استخدام لا نهاية لها من التحكم الآلي إلى أتمتة واجهة المستخدم الرسومية.
⚠️ لا تقع في حب الرموز المزيفة أو المقلدين. تحقق دائما من المصادر الرسمية.
3.73K
يسعدنا أن نرى المجتمع الصيني يلاحظ CodecFlow ويحب ما نبنيه.
أهلًا وسهلًا. لقد بدأنا للتو. وهناك الكثير في المستقبل.

0xFunky13 يوليو 2025
انتهى البيع العام ل PUMP ، في الأصل كنت أيضا مبلغا كبيرا على Bybit ، وتم وضع 1/2 فقط على السلسلة ، وفي النهاية ، نجحت السلسلة فقط ، ولكن لحسن الحظ لم يكن هناك تحوط مقدما ...
في الآونة الأخيرة ، كان العديد من الأشخاص في مجتمع الذكاء الاصطناعي يناقشون VLA (الرؤية - اللغة - العمل).
لقد بحثت على وجه التحديد فيما إذا كان أي شخص يقوم بمشاريع متعلقة ب VLA على السلسلة ، ورأيت هذا المشروع CodecFlow@Codecopenflow واشتريت القليل.
== ماذا يفعل CodecFlow ==
مقدمة موجزة عن VLA ، VLA هي بنية نموذجية تسمح الذكاء الاصطناعي ليس فقط "بالتحدث" ولكن "العمل".
يمكن لLLMs التقليدية (مثل GPT) فهم اللغة وتقديم الاقتراحات فقط ، لكنها لا تستطيع فعل أي شيء أو النقر على الشاشات أو الاستيلاء على الأشياء.
يعني نموذج VLA أنه يدمج ثلاث قدرات رئيسية:
1. الرؤية: فهم الصور أو لقطات الشاشة أو مدخلات الكاميرا أو بيانات المستشعر
2. اللغة: فهم تعليمات اللغة الطبيعية من البشر
3. الإجراء: قم بإنشاء تعليمات قابلة للتنفيذ مثل نقرات الماوس ومدخلات لوحة المفاتيح والتحكم في الأذرع الروبوتية
يقوم CodecFlow بعمل VLA على السلسلة ، ويمكن أيضا أن تكون جميع العمليات على السلسلة وقابلة للتدقيق والتحقق منها وقابلة للتسوية.
ببساطة ، إنها البنية التحتية ل "روبوتات الذكاء الاصطناعي".
== لماذا أوليت اهتماما خاصا لهذا المشروع؟ ==
لقد وجدت أن مطوريهم هم المساهمون الأساسيون في LeRobot ، وهو المشروع مفتوح المصدر الأكثر سخونة في مساحة VLA!
LeRobot هي القاعدة العليا لبناء نماذج VLA في عالم المصادر المفتوحة ، بما في ذلك VLA خفيفة الوزن مثل SmolVLA التي يمكن تشغيلها على أجهزة الكمبيوتر المحمولة.
هذا يعني أن هذا الفريق يفهم حقا بنية VlA ويفهم الروبوتات.
أرى أنهم يواصلون البناء أيضا ، كما أن سعر العملة يرتفع بشكل مطرد ، وأنا متفائل جدا بشأن مسار VLA ، ومن الاتجاه العام ، فإن VLA والروبوتات هي بالفعل المستقبل في السوق.
• عمالقة Web2 (Google و Meta و Tesla) ملتزمون حاليا تماما بتدريب VLA والروبوتات.
• هناك عدد قليل جدا من مشاريع Web3 التي يمكنها تنفيذ تطبيقات VLA ، ولا تزال نادرة جدا
• لدى VLA الفرصة للعب قيمة كبيرة في سيناريوهات مثل DePIN ، وأتمتة الويب ، وتنفيذ عامل الذكاء الاصطناعي على السلسلة ، وما إلى ذلك.
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
دائما DYOR。
3.99K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز