تتزايد التحديات أمام السيارات الذاتية القيادة (Autonomous Vehicles) في تمكينها من اتخاذ قرارات موثوقة أثناء التنقّل في المناطق الحضرية المكتظة، حيث تعتبر سلوكيات المشاة (Pedestrian Behaviors) غير قابلة للتنبؤ في العديد من الأحيان. ورغم أداء أنظمة التحكم القائمة على التعلم المعزز (Reinforcement Learning) بشكل جيد في الظروف المرورية المنظمة، إلا أنها تعاني من صعوبات حادة عند التعامل مع التفاعلات غير المتوقعة مع المشاة.

لتجاوز هذه العقبات، تم تقديم إطار عمل جديد يعتمد على نموذج لغة كبير (Large Language Model - LLM) كمحور لاتخاذ القرارات. يقوم هذا النظام بتحويل المشاهد المراقبة إلى استجابات مفهومة بلغة طبيعية، مما يمكّن النموذج من استنتاج نوايا المشاة وتوقع المخاطر، وبالتالي توليد قرارات قيادة حذرة.

وقد تم تقييم هذا النظام في إطار محاكاة SUMO عبر مجموعة من السيناريوهات، بما في ذلك العبور غير المتوقع وسلوكيات التردد والتوجهات المتبادلة. في نتائج مبهرة، حقق النموذج المعتمد على LLM معدل نجاح بدون تصادم يبلغ 68%، متفوقاً بشكل كبير على معايير التعلم العميق التقليدية (17.7%). ومع تحسين الذاكرة الحلقية (Few-shot Episodic Memory)، ارتفع أداؤه ليصل إلى 96% في حالة المشاة الواحدة.

علاوة على ذلك، أثبتت نتائج التقييم العابر للسلوكيات أن الذاكرة المستمدة من التفاعلات السابقة تساعد في التعامل مع السيناريوهات غير المتوقعة، حيث بلغت معدلات النجاح 82% و90% على التوالي. ميزات أخرى مميزة تتضمن الاستجابة المبكرة، الحفاظ على مسافات أمان واسعة، واتخاذ قرارات يمكن فهمها وموافقتها للمنطق البشري.