𝗚𝗿𝗮𝗻𝗱𝗲 𝗼𝗯𝗷𝗲𝗰𝘁 𝗱𝗲𝘁𝗲𝗸𝗰𝗷𝗮 𝗶 𝗻𝗮𝗹𝗲𝘇𝗻𝗼𝘀𝗰 𝗼𝗯𝗷𝗲𝗰𝘁𝗼𝘄 𝗱𝗼 𝗿𝗼𝗯𝗼𝘁𝘆𝗸𝗶 W robotyce, detekcja obiektów to migawka: „na tym kadrze znajduje się butelka w (x, y).” Śledzenie obiektów to trudniejsza, bardziej operacyjna rzecz: „to ta sama butelka co wcześniej, poruszała się w ten sposób i nadal tam jest, nawet jeśli nie widzę jej przez 200 ms.” Wyobraź sobie mobilnego manipulatora na blacie kuchennym. Zadanie jest proste na papierze: weź niebieską butelkę z zagraconego stołu, podczas gdy osoba porusza się w pobliżu. Robot ma kamerę (może też głębokościową). Uruchamia detektor obiektów i otrzymuje ramkę ograniczającą oznaczoną „butelka” z wynikiem pewności. To brzmi jak percepcja. Jeszcze nie. Na kadrze 1 detektor widzi butelkę. Na kadrze 2 ramię osoby częściowo ją zasłania, pewność spada, a ramka znika. Na kadrze 3 butelka ponownie się pojawia, ale detektor nieco przesuwa ramkę. Z perspektywy planera butelka zniknęła z istnienia i teleportowała się. W zagraceniu pojawiają się również duplikaty: detektor może wygenerować dwie wiarygodne ramki „butelka” dla tego samego obiektu. Jeśli robot reaguje bezpośrednio na detekcje z każdego kadru, widzisz klasyczne zachowania awaryjne: ➤ waha się, ponieważ cel jest „nieobecny” co kilka kadrów, ➤ ciągle przelicza, ponieważ pozycja celu drga, ➤ sięga w kierunku niewłaściwego obiektu, gdy pojawiają się dwa podobne przedmioty, ➤ nie może niezawodnie egzekwować „nie koliduj z osobą”, ponieważ ramka osoby również migocze. Dlatego percepcja robotyki rzadko kończy się na detekcji. Potrzebuje trwałości obiektów: zdolności do powiedzenia „to nadal ta sama butelka, nawet jeśli na chwilę stracę ją z oczu.” Śledzenie to to, co przekształca zgadywania z kadru na kadr w stabilny model świata. Typowe podejście to „śledzenie przez detekcję”: nadal uruchamiasz detektor w każdym kadrze, ale przypisujesz detekcje do trwałych śladów (ID) w czasie, używając prognozowania + asocjacji. Konkretnie, śledzący wykonuje trzy rzeczy: ➤ Prognozuje „gdzie powinna być butelka teraz?” ➤ Asocjuje „która detekcja należy do którego śladu?” ➤ Utrzymuje tożsamość w obliczu zmian ...