المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
الذكاء الاصطناعي معيب في التصميم.
ليس بسبب النية الخبيثة أو أي شيء آخر ، ولكن لأنه يمثل الواقع والواقع احتمالي. تصبح الحقيقة كل ما تقرره الأوزان.
هذه هي مشكلة LLMs ، فهم يتنبأون فقط بالرمز المميز التالي.
باتباع الأنماط الخطية للاستعلامات ، فإنه يطابق الاستجابات المناسبة ويتعرف عليها ويعكس ذلك.
أنت تطلب ثلاثة عناصر. يعطي أربعة.
لماذا هذا؟
يبدأ التحيز المعرفي البارامتري: تتجاوز بيانات التدريب القوية الاستعلامات الضعيفة ، وتخلط بين المصادر حتى يعتقد النموذج ضغطه الخاص على العالم.
هل سبق لك أن استفسرت عن الذكاء الاصطناعي وحصلت على الإجابة ، "لا أعرف" هذا نادر الحدوث أو ربما لم يحدث أبدا.
لأن هذا المفهوم غافل عنهم. يبدو أنهم يعرفون كل شيء حتى في موضوع خارج مجالهم.
يطور الذكاء الاصطناعي نظاما يعتمد على مبادئ الحوسبة العصبية التي تحاكي الآلية الفيزيائية للذاكرة البشرية والشك.
عادة ما تكون الاستفسارات المعقدة ضحية لمثل هذه الظروف - يتم الترحيب بها من خلال الهلوسة المذهلة.
لماذا؟
>> الخطأ المركب في خطواته
>> عدم وجود هيكل مشكلة
>> إلهاء السياق غير ذي الصلة
@SentientAGI لديه حل - ROMA [عامل التعريف المفتوح المتكرر] → المنسق.
في لعبة المهام ذات الأفق الطويل ، الهيكل أكثر أهمية من الذكاء.
يدرك ROMA هذا وبالتالي يعتمد سلسلة قيادة هرمية متكررة تحافظ على تدفق السياق.
كيف يعمل روما - الرئيس النهائي لمعالجة مهام الأفق الطويل؟
يمنح ROMA الوكلاء سقالات متكررة - شجرة مهام هرمية تتحكم في كيفية تدفق السياق.
بمجرد كسر تدفق السياق ، تتسلل الفوضى.
لذلك يتم فرض ROMA لإدارة تدفق السياق.
للتعامل مع هذا بفعالية، روما؛
يفصل ويحلل المهام إلى وكلاء فرعيين متميزين يعرفون باسم العقد ، خاصة المهام التي تعتبرها معقدة.
دعنا نسمي ROMA مدير الذكاء الاصطناعي الذي يدير الذكاء الاصطناعي الأخرى.
في صورة بسيطة ، إليك الهيكل:
العقد الأصلية: وكلاء رفيعي المستوى يتلقون هدفك المعقد.
=> يقومون بتقسيمها إلى مهام فرعية وتمريرها إلى العقد الفرعية (وكلاء / أدوات أبسط).
=> تقوم العقد الفرعية بحل قطعتها ، وإرسال النتائج مرة أخرى إلى العقد الأصلية.
=> تقوم العقد الأصلية بتجميع الحلول ودمجها في الإجابة النهائية.
تم حل الاستفسار!
أربعة أنواع من العقد التي تقود نظام ROMA:
>> رذاذ - إيماءة المحدد. تقييم المهمة. يحدد ما إذا كانت بسيطة بما يكفي للتنفيذ؟ أم أنها تحتاج إلى التحلل؟
>> مخطط - إذا كانت المهمة بحاجة إلى تحلل - يقسم الأهداف المعقدة إلى مهام فرعية. تصبح كل مهمة فرعية عقدة فرعية. يمكن تشغيل المهام بالتتابع (عند التبعية) أو بالتوازي (عندما تكون مستقلة).
>> المنفذ - يؤدي العمل. أدوات المكالمات والوكلاء وواجهات برمجة التطبيقات. يمرر المخرجات لأعلى أو لأسفل الشجرة حسب الحاجة.
>> المجمع - يجمع النتائج من العقد الفرعية ، ويتحقق من الاتساق ، ويجمع الإجابة النهائية.
إليك رسم توضيحي 👇 شامل
استفسار: "كم عدد الأفلام ذات الميزانية المحدودة بقيمة 350 مليون دولار + لم تكن الأعلى ربحا في عام إصدارها؟"
عملية روما:
1 / فحوصات البخاخة - العقدة المحددة. معقدة جدا لخطوة واحدة؟ يأتي البخاخة.
2 / المخطط. هدف معقد للغاية؟ يأتي المخطط ، ويتحلل:
المهمة الفرعية 1: ابحث عن جميع الأفلام التي تبلغ قيمتها 350 مليون دولار + (العناوين والميزانيات والسنوات)
المهمة الفرعية 2: البحث عن الأفلام الأعلى ربحا سنويا
المهمة الفرعية 3: الإسناد الترافقي والتصفية
3 / يقوم المنفذون بتشغيل كل مهمة فرعية (واجهات برمجة تطبيقات البحث ، نماذج الاستخراج)
4 / يقوم المجمع بتوليف المواد: قائمة نظيفة من معايير مطابقة الأفلام.
إلى جانب صيغ الحلقة العودية للعقدة في ROMA ، فقد أضافت طبقة إضافية من الوضوح لاتحاد الجمهوريات الاشتراكية السوفياتية والبنائين.
الإنسان في الحلقة = تدخل المستخدم.
ميزة آلية ملاحظات متأصلة تسمح بمنح غير مصرح للمستخدمين بالتحقق من حالة الاستعلام الخاص بهم. يحدث هذا مباشرة بعد مرحلة التخطيط.
"لقد وجدت هذه الحقائق. هل هم على حق؟ لقد خططت لهذه التكديس الفرعي - هل تتوافق مع ما تريد؟ يتيح ذلك للمستخدم تصحيح السياقات أو تحريرها أو إضافتها قبل متابعة العامل.

تتبع المرحلة - للبناة
للمطور الذي يقوم ببناء العامل أو تصحيحه. يكشف تتبع المرحلة عن المنطق الداخلي:
>> ما هي المدخلات التي تلقتها هذه العقدة؟
>> ما هو الناتج الذي أنتجته؟
>> أين ضاع السياق أو شوه؟
يستخدم المنشئ هذه الشفافية من أجل:
>> تشخيص مكان حدوث الفشل.
>> تحسين المطالبات في عقد محددة
>> مبادلة الوكلاء / الأدوات ذات الأداء الضعيف.
تساعد هذه الميزة المستخدمين على اكتشاف الأخطاء في الوقت الفعلي ، ويساعد المنشئون على إصلاح المشكلات المنهجية على المستوى المعماري.
الاستخدام في العالم الحقيقي
بحث ROMA كدليل على المفهوم يستفيد من جميع بنية ROMA مع SEAL-0 ، وهو اختبار لمعيار التفكير المعقد متعدد المصادر الذي يبلغ 45.6٪ (أحدث طراز) أفضل سابق (باحث Kimi): 36٪ ، Gemini 2.5 Pro: 19.8٪ ، أفضل منافس مفتوح المصدر: 8.9٪.
1.87K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

