تعتبر تنقلات الأرصفة التلقائية (Autonomous Sidewalk Navigation) عنصرًا أساسيًا في تطبيقات التنقل الصغير مثل توصيل الطعام بالروبوتات وكراسي الاستلقاء الإلكترونية المساعدة. وعلى عكس القيادة الذاتية على الطرق، تتطلب تنقلات الأرصفة الطويلة مناورة دقيقة عبر أرصفة مليئة بالمارة وبأراضي غير متوقعة، وذلك مع اعتماد الحد الأدنى على أدوات الإحساس التي قد لا تتجاوز كاميرا RGB أحادية.

في هذا السياق، يقدم الباحثون في هذا المجال تقنية جديدة تُعرف باسم FlowPilot، التي تمثل سياسة تنقل بدون خريطة (Mapless Navigation Policy) تحسن الأداء في التنقل الطويل باستخدام نفس الكاميرا الأحادية فقط. ولحل المشاكل المتعلقة بخطأ التكرار ونقص الالتزام بالمعايير الاجتماعية، تم إجراء تحفيض مثل التعلم بالتمثيل (Imitation Learning) المستخدم في الابتكارات السابقة. هل تساءلت كيف يمكن تحسين هذا الخوارزم من خلال التعلم من تفضيلات البشر؟

يستخدم FlowPilot طريقة تمثيل الحركة المرتبطة (Anchored Flow Matching) لتدريب السياسة على بيانات من أسطول كبير من الروبوتات، لالتقاط السلوكيات المتنوعة والمعقدة المتعلقة بتنقلات الأرصفة. ولتضييق الفجوة بين التقليد والملائمة، تم تصميم نظام تعلم تفضيلات البشر (Human-in-the-loop Preference Learning) الذي يقوم بضبط السياسة بناءً على كمية صغيرة من بيانات التدخل البشري، مما يعزز من قدرة النموذج على التفكير في حالات عدم اليقين والامتثال الاجتماعي.

عند تقييم FlowPilot في بيئات الأرصفة المختلفة، حقق نجاحًا يصل إلى 42% في المحاكاة و66% في إكمال المسار، بينما زادت قوة النموذج وامتثاله للمعايير الاجتماعية في العالم الواقعي، حيث انخفضت معدلات السقوط بنسبة 40% و52% مقارنة بالنموذج الأساسي.

إن هذا التطور يعد خطوة كبيرة نحو جعل التنقل الذاتي عبر الأرصفة أكثر أمانًا وفعالية، فما هي آراءكم حول هذه الابتكارات؟ شاركونا بتعليقاتكم!