تتبع واكتشاف الأجسام في مجال الروبوتات في الروبوتات، اكتشاف الأجسام هو لقطة سريعة: "هناك زجاجة عند (x, y) في هذا الإطار." تتبع الأجسام هو الأمر الأصعب والأكثر عملية: "هذه نفس الزجاجة كما من قبل، تحركت هكذا، ولا تزال موجودة حتى لو لم أرها لمدة 200 مللي ثانية." تخيل جهاز تحكم متحرك على طاولة المطبخ. المهمة بسيطة على الورق: التقاط الزجاجة الزرقاء من طاولة مزدحمة بينما يتحرك شخص بالقرب منهم. الروبوت لديه كاميرا (وربما عمق أيضا). يشغل كاشف الكائنات ويحصل على صندوق إطار يحمل علامة "زجاجة" مع درجة ثقة. يبدو هذا كأنه تصور. لم يحدث بعد. في الإطار الأول، يرى الكاشف الزجاجة. في الإطار الثاني، ذراع الشخص تحجب الصندوق جزئيا، تنخفض الثقة، ويختفي الصندوق. في الإطار الثالث تظهر الزجاجة مرة أخرى لكن الكاشف يتحرك الصندوق قليلا. من وجهة نظر المخطط، الزجاجة اختفت من الوجود وانتقلت بالتليبورتيشن. في حالة الفوضى، تحصل أيضا على نسخ مكررة: قد ينتج الكاشف صندوقي "زجاجة" معقولين لنفس الشيء. إذا تفاعل الروبوت مباشرة مع اكتشافات كل إطار، سترى سلوكيات فشل كلاسيكية: ➤ يتردد لأن الهدف "يخطئ" كل بضعة لقطات، ➤ يعيد التخطيط باستمرار لأن موقع الهدف يتأرجح، ➤ يمد يده نحو الجسم الخطأ عندما يظهر عنصران متشابهان، ➤ لا يمكنه فرض "لا تصطدم بالشخص" بشكل موثوق لأن صندوق الشخص يومض أيضا. لهذا السبب نادرا ما يتوقف إدراك الروبوتات عند الكشف. يحتاج إلى ديمومة كالشيء: القدرة على القول "هذه لا تزال نفس الزجاجة، حتى لو فقدت رؤيتها لفترة وجيزة." التتبع هو ما يحول التخمينات إطارا بإطار إلى نموذج عالم مستقر. النهج النموذجي هو "التتبع عن طريق الكشف": حيث تستمر في تشغيل كاشف في كل إطار، لكنك تربط الاكتشافات بالمسارات الدائمة (IDs) مع مرور الوقت باستخدام التنبؤ + الارتباط. بشكل ملموس، يقوم المتتبع بثلاثة أشياء: ➤ التنبؤ ب "أين يجب أن تكون الزجاجة الآن؟" ➤ المرتبط "أي اكتشاف ينتمي لأي مسار؟" ➤ الحفاظ على الهوية تحت التغييرات ...