القوة المكانية تعزز إدراك الروبوت ثلاثي الأبعاد
تعمل استراتيجية التوصيل والتشغيل هذه على محاذاة نماذج VLA مع نماذج الأساس ثلاثية الأبعاد لاكتساب الوعي المكاني. حقق SOTA في المهام الروبوتية مع تدريب أسرع 3.8 مرة ونجاح أعلى بنسبة 50٪ في العالم الحقيقي ، بدون مستشعرات ثلاثية الأبعاد صريحة!
مختبر شنغهاي الذكاء الاصطناعي يكشف النقاب عن VPPO ل RL متعدد الوسائط
تسلط هذه الطريقة الجديدة الضوء على "إدراك الرمز المميز" لجعل سبب LVLMs أفضل. إنه يحقق أحدث النتائج ، مع ثبات فائق وتقارب أسرع على 8 معايير.
عندما تلتقي الأفكار بالحقائق: جديد من الأمازون & KAIST
يمكن ل LCLMs معالجة سياقات واسعة ، ولكنها تكافح مع التفكير. تقدم ToTAL "قوالب فكر" قابلة لإعادة الاستخدام تبني الأدلة ، وتوجه الاستدلال متعدد القفزات بوثائق واقعية.