Spårning och objektdetektering för robotik Inom robotik är objektdetektion en ögonblicksbild: "det finns en flaska vid (x, y) i denna ram." Objektspårning är det svårare, mer operativa: "det här är samma flaska som tidigare, den rörde sig så här, och den är fortfarande kvar även om jag inte ser den på 200 ms." Föreställ dig en mobil manipulatör vid en köksbänk. Uppgiften är enkel på papper: plocka upp den blå flaskan från ett rörigt bord medan en person rör sig i närheten. Roboten har en kamera (kanske djup också). Den kör en objektdetektor och får en begränsningsruta märkt "flaska" med ett konfidensvärde. Det låter som perception. Det är det inte än. På bildruta 1 ser detektorn flaskan. På bild 2 täcker personens arm den delvis, självförtroendet sjunker och lådan försvinner. På bild 3 dyker flaskan upp igen men detektorn flyttar lådan lite. Ur planerarens perspektiv har flaskan blinkat bort och teleporterats. I clutter får du också dubbletter: detektorn kan producera två trovärdiga "flask"-lådor för samma objekt. Om roboten reagerar direkt på detektioner per bildruta ser du klassiska felbeteenden: ➤ den tvekar eftersom målet "missar" var några bildrutor, ➤ den planerar om hela tiden eftersom målpositionen skakar, ➤ den sträcker sig mot fel objekt när två liknande föremål dyker upp, ➤ Den kan inte pålitligt upprätthålla "krocka inte med personen" eftersom personens låda också flimrar. Det är därför robotperception sällan stannar vid upptäckt. Den behöver objektpermanens: förmågan att säga "det här är fortfarande samma flaska, även om jag tappar bort den för en stund." Spårning är det som förvandlar bildruta-för-bild-gissningar till en stabil världsmodell. Ett typiskt tillvägagångssätt är "spårning genom detektering": du kör fortfarande en detektor varje bildruta, men kopplar detektioner till persistenta spår (ID) över tid med hjälp av prediktion + association. Konkret gör trackern tre saker: ➤ Förutsäg "var ska flaskan vara nu?" ➤ Associera "vilken detektering tillhör vilken spår?" ➤ Behåll identitet under förändringar ...