تواجه الروبوتات الذاتية القيادة تحديات هائلة عند التعامل مع الحشود الكثيفة والديناميكية. غالباً ما تفشل الطرق التقليدية القائمة على التخطيط التفاعلي، مثل التحكم باستخدام نموذج التنبؤ بالمسار (Model Predictive Path Integral - MPPI)، في الخروج من الحد الأدنى المحلي في سيناريوهات معقدة، وذلك بسبب أفق التنبؤ المحدود. لذا، تم تقديم تقنية جديدة تدعى RAY-TOLD، والتي تعتمد على ديناميات مختفية موجهة بواسطة الأشعة.

تجمع RAY-TOLD بين معلومات العقبات والديناميات المختفية، وهي معمارية تحكم هجينة تجمع بين فعالية عناصر التحكم الفيزيائية مع أفق الرؤية الطويلة الذي يقدمه التعلم المعزز. تعتمد هذه التقنية على نموذج ديناميات مختفي يعتمد على تقنية LiDAR، مما يسمح بترميز بيانات المستشعرات العالية الأبعاد في تمثيل دولة مضغوط.

تقدم RAY-TOLD أيضاً استراتيجية عينة مزيج السياسة التي تعزز من مجموعة مرشحي MPPI بالمسارات المأخوذة من السياسة المتعلمة، مما يرشد مخطط الحركة نحو الهدف مع الحفاظ على الجدوى الحركية. لقد أثبتت اختبارات شاملة في بيئة تصادفية مع عقبات ديناميكية كثيفة أن طريقتنا تتفوق على القاعدة الأساسية لـ MPPI، حيث تقلل من معدل الاصطدامات بشكل ملحوظ.

تؤكد النتائج أن دمج عمليات الإطلاق القصيرة الأساسية فيزيائياً مع نية طويلة الأمد متعلمة تعزز بشكل كبير من موثوقية وأمان التنقل.