في قلب الإدراك البصري البشري تكمن القدرة على الحفاظ على فهم متواصل ومتسق للعالم الخارجي. ينجح النظام البصري البشري في دمج الملاحظات مع التجارب المتراكمة، مما يجعله يتكيف باستمرار مع التغيرات في كل من الهدف والبيئة المحيطة، مع الحفاظ على استمرارية بصرية قوية حتى مع تطور ديناميات المشهد.

يهدف تتبع الأجسام (Object Tracking) كإحدى المشاكل الأساسية في رؤية الكمبيوتر (Computer Vision) إلى تقريب إدراك الآلات من الإدراك البصري البشري. بناءً على ذلك، تمثل مهمة تتبع الأجسام العامة (Generic Object Tracking - GOT) تحدياً عميقاً، حيث يتم تهيئة متتبع بصري فقط باستخدام صندوق حدودي (Bounding Box) لهدف محدد بشكل تعسفي في الإطار الأول، ويجب عليه تحديد موقع الهدف بشكل مستمر في التدفقات البصرية الديناميكية اللاحقة.

إلا أن الأحداث المستقبلية، والملاحظات، والتغيرات الواقعية تكون غير متوقعة بطبيعتها. لهذا السبب، تبقى قدرات النموذج في العامة والتكيف عبر الإنترنت نقاط ضعف. يمكن أن تتدهور موثوقية التتبع عندما يتعرض الهدف لتشوه كبير، أو عندما تؤثر عليه عوامل مزعجة معقدة، أو يتعرض لتغيرات بيئية ملحوظة، أو ينتمي إلى فئة لم يتم رؤيتها أثناء التدريب.

يهدف هذا البحث إلى سد الفجوة بين أنظمة تتبع الرؤية الآلية وإدراك الرؤية البشرية من خلال اقتراح مجموعة من الأساليب التي تعزز بشكل منهجي قدرة التمييز (Discrimination) وملاءمة التكيف (Adaptation) والاستدلال الهندسي (Geometric Reasoning) لنماذج التتبع. لذا، تبقى الجهود مستمرة لإيجاد حلول مبتكرة تعزز دقة التتبع وتساعد في فهم أفضل للبيئة المحيطة.