في إطار التطورات الأخيرة في تقنيات التحكم، تمكنت الروبوتات ذات العجلات الثنائية من اجتياز المنحدرات والعقبات ذات الخطوة الواحدة، لكن تبقى التنقل عبر السلالم الطويلة تحديًا كبيرًا. الاختلافات الحالية في نماذج التعليم التجديدي تعاني من ضعف تمثيلات الديناميكا وعدم اكتمال تشفير التضاريس.

هنا يأتي الابتكار الجديد DynaWM، وهو إطار لتعلم تمثيلات الديناميكا. هذا الإطار يعزز قدرة تشفير التضاريس ويتيح تقييمًا شفافًا من خلال تقديم نموذج عالمي يعمل كمعزز للتعلم، مما يحافظ على الطبوغرافيا الكاملة للتضاريس ويسهل تصور الترميز الهرمي.

لتحقيق استقرار أفضل في نقل المعرفة، نستخدم مشفر الأهداف الزخم (momentum target encoder) الذي يوفر أهداف تقطير متسقة، مما يمنع التدهور الأبعاد الناتج عن تحديثات المعلم غير المستقرة.

المراجعات التجريبية باستخدام تحليل المكونات الرئيسية (PCA) تكشف أن هذا المشفر يلتقط الطبوغرافيا بشكل هرمي مع قدرة تشفير تضاريس أعلى، مما يؤدي إلى تحسين ملاءمة التضاريس ونعومة الحركة. التجارب على المحاكاة والأجهزة الحقيقية تظهر أن الطريقة الجديدة تحقق تفوقًا في ملاءمة التضاريس ونعومة الحركة، مما يمكّن الروبوتات ذات العجلات الثنائية من تجاوز السلالم المستمرة المتنوعة.