في عالم السيارات الذاتية القيادة، تتسم الأنظمة التي تعتمد على نماذج رؤية-لغة-عمل (Vision-Language-Action) بالقوة في سيناريوهات القيادة الشائعة، ولكنها تظل معرّضة للهشاشة عند مواجهة مواقف نادرة ولكن حرجة من الناحية الأمنية، مثل مناطق البناء النشطة وأشكال التحويل المعقدة. في ورقتنا هذه، نقدم تقنية جديدة تُعرف باسم CLAP (تحسين التوجيه في الفضاء الكامن)، والتي تُبرز إطارًا يركز على التكيف المكاني.

تعمل CLAP على تعزيز نموذج قيادة يعتمد على VLA متجمد، حيث تُستخدم موجهات ناعمة متعلقة بالطرق، تم تحسينها استنادًا إلى بيانات تم جمعها من قبل الجمهور ويتم استرجاعها حسب الطلب عبر الاتصالات بين المركبات (Vehicle-to-Everything - V2X). يعتمد منهجنا على ملاحظتين رئيسيتين من الفضاء الكامن لنماذج VLAs:
1. عند طبقة الحالة المخفية في VLA، تتكدس السيناريوهات من نفس مجموعة الموانع بشكل ضيق وتشغل مناطق مضغوطة من الفضاء الكامن.
2. داخل كل حاجز، يتم خلط الإطارات الحادة والعادية بشكل مكثف في التمثيل الكامن، مما يجعل تحسين واحدة دون الإخلال بالأخرى أمرًا صعبًا.

تتعامل CLAP مع ذلك من خلال سلسلة من مرحلتين: الأولى، التعلم المتباين المُشرف لاكتشاف اتجاه المشهد الصعب القائم على الحواجز، تليها تحسين التوجيه المُنظم باتجاه معين الذي يحسن بشكل انتقائي الإطارات التحديّة مع الحفاظ على أداء الإطارات العادية.

على معيار NAVSIM، وباستخدام مجموعة متنوعة من نماذج VLA المتطورة، أظهرت CLAP انخفاضًا بنسبة 24% في أخطاء تخطيط السيناريوهات الصعبة دون أي تدهور في أداء الإطارات العادية، مما يُحسّن بشكل كبير من أداء التخطيط للقيادة الذاتية.

باستخدام هذه التقنية المتطورة، يمكن لقيادة المركبات أن تواجه تحديات الطريق بفعالية أكبر، مما يمهد الطريق لمستقبل أكثر أمانًا للقيادة الذاتية. هل تتوقع أن تغيّر هذه التقنية المبتكرة مستقبل السيارات الذاتية؟ شاركونا آرائكم في التعليقات!