في خطوة جديدة في عالم الذكاء الاصطناعي والتنقل الروبوتي، كشف فريق من الباحثين عن MVP-Nav، وهو إطار عمل مبتكر للروبوتات يهدف إلى مواجهة التحديات المحورية التي تواجه التنقل الذكي باستخدام التصوير RGB فقط.

تتجلى أهمية هذا النظام في التعامل مع مشكلة “التنقل نحو هدف مُعيّن دون معلومات مسبقة” (Zero-shot Object Goal Navigation - ZSON)، حيث كانت الروبوتات تواجه صعوبات جسيمة بسبب عدم توفر معلومات العمق، ما يزيد من نسبة عدم اليقين الجسدي وسوء المحاذاة بين الدلالة الفيزيائية والدلالات الأخرى.

النهج التقليدي كان يعتمد إما على استدلالات دلالية عالية المستوى دون أساس هندسي، أو التعلم من خلال سياسات شاملة تفتقر إلى القيود الجسمية، مما يؤدي غالبًا إلى سلوكيات تبدو معقولة دلاليًا ولكنها غير آمنة من الناحية الفيزيائية.

لكن مع MVP-Nav، يتحول الأمر إلى تجربة غنية تعيد دمج الإدراك والتخطيط والتحكم بما يتماشى مع العالم ثلاثي الأبعاد الحقيقي. يقوم النظام بإعادة بناء المحتوى الفيزيائي الصريح من الملاحظات أحادية العين عن طريق استخدام نماذج أساسية ثلاثية الأبعاد، مما يجعل التمثيل الدلالي المكاني أكثر دقة وفاعلية.

علاوة على ذلك، يتم تقديم خريطة قيمة متعددة الطبقات (Multi-layer Value Map - MVM) التي تدمج الأولويات الدلالية مع الهندسة المُعاد بنائها في مساحة تكلفة مشتركة، مما يمكّن من التخطيط الجغرافي الذي يعتمد على أسس جسدية.

أظهرت التجارب المكثفة على معايير التنقل دون نقطة عمق أن MVP-Nav يتفوق بشكل كبير على الطرق الحالية، محققا أداءً رائعًا يثبت أن استخدام المبادئ الجسدية المنظمة يمكن أن يعوض بشكل فعال عن غياب أجهزة استشعار العمق النشطة.