في خضم التحولات السريعة في عالم القيادة الذاتية، يبرز إطار العمل LWDrive كابتكار ثوري يعتمد على نماذج اللغة والرؤية (Vision-Language Models) لتعزيز التخطيط لنظم القيادة الذاتية (End-to-End Autonomous Driving - E2E-AD). رغم القوة التي توفرها نماذج اللغة والرؤية، إلا أن المسارات الناتجة عنها غالباً ما تكون بدائية وتفتقر إلى الدقة الهندسية والرؤية المستقبلية.

لتجاوز هذه العوائق، يقدم LWDrive كيفية جديدة للتخطيط عبر توجيه نموذج العالم على أساس طبقي (Layer-Wise World-Model-Guided). بدلاً من اعتبار مخرجات نماذج اللغة والرؤية كنهاية المطاف، يعتمد LWDrive عليها كخطة بدائية مدفوعة بالنية، ويدعو لتوسيع مساحة الخيارات المتنوعة حولها.

من خلال استخدام مبدأ يُعرف باسم المُخطط المتسلسل الموقعي (Foresight Cascade Planner - FCP)، يدفع LWDrive الموديل للتعلم عن التوجهات المستقبلية، مما يعزز التنبؤات داخل الحالات النفسية للنموذج. فبدعم من هذه التمثل اللغوي المدعوم بالنموذج العالمي، يعمل المخطط FCP على مزج الميزات المستخرجة من النماذج عبر طبقات متعددة ومعالجة بيانات الزمن التاريخية لتصحيح المسارات بشكل تدريجي.

هذه العملية لا تعزز من دقة الحركة فحسب، بل تدمج أيضًا الأدلة المرئية متعددة الزوايا لتأكيد دقة التخطيط. تكمن قوة LWDrive في استمرارية تصحيح المسارات بالتوازي مع الحفاظ على النية العليا للقيادة، مما يجعلها واحدة من أبرز الابتكارات في هذا المجال.

أثبتت التجارب أن LWDrive يحقق درجة 92.0 على معيار NAVSIM و89.6 على NAVSIM-v2، مما يبرز تفوقه على التقنيات الحالية. والجدير بالذكر أن الشيفرات والنماذج ستكون متاحة للجمهور، مما يفتح آفاقًا جديدة للابتكار في عالم القيادة الذاتية.

ما رأيكم في هذه التطورات المذهلة في عالم القيادة الذاتية؟ شاركونا أفكاركم في التعليقات!