تتسارع وتيرة التطور في أنظمة القيادة الذاتية، حيث أصبح من الضروري استخراج السيناريوهات عالية القيمة، والتي تتعلق بالسلامة والتخطيط، من سجلات القيادة الضخمة لتقييم فعالية البيانات. وفي هذا السياق، طرح فريق البحث تقنية آوتوماين (AutoMine)، والتي تعد طريقة متطورة لاستخراج السيناريوهات ذات الأهمية باستخدام نماذج لغوية كبيرة (Large Language Models) ونماذج التصوير البصري (Visual Language Models).

تستفيد آوتوماين من تعزيز النصوص بطريقة تحافظ على الدلالات، مما يقلل من حساسية نماذج اللغة الكبيرة تجاه المحتوى المدخل، وتدمج بين وظائف المسار القوي ووظائف النماذج البصرية لمعالجة الضوضاء البصرية والإشارات المرئية في بيئات العالم المفتوح. كما أن العملية تتضمن تحسين الكود المستخرج عبر التغذية المرتدة من سجلات القيادة الحقيقية.

خلال مسابقة Argoverse 2 Scenario Mining التي أقيمت في مؤتمر CVPR 2026، حققت آوتوماين إنجازات ملحوظة، حيث سجلت نقاط HOTA-Temporal تصل إلى 36.38 ونقاط Timestamp BA تصل إلى 77.21. هذه النتائج تعكس الابتكار والقدرة الفائقة للتقنية في معالجة السيناريوهات المعقدة، مما يعد خطوة كبيرة نحو تحسين أنظمة القيادة الذاتية في المستقبل.

ما رأيكم في هذه التطورات التقنية المذهلة؟ شاركونا آراءكم في التعليقات.