تتزايد أهمية القيادة الذاتية كأحد المهام المهمة ذات الصلة بالسلامة، وقد أظهرت التطورات الأخيرة في نماذج اللغات الضخمة (Large Language Models) ونماذج الرؤية اللغوية (Vision-Language Models) إمكانيات جديدة في مجالي التخطيط والاستدلال. ومع ذلك، فإن النماذج الكبيرة تتطلب ذاكرة GPU كبيرة وتظهر زمن استجابة مرتفع، مما يجعل من الصعب تطبيقها في السياقات العملية.
تقديم Drive-KD، إطار عمل مبتكر يهدف إلى حل هذه التحديات من خلال تقسيم عملية القيادة الذاتية إلى ثلاث حلقات متكاملة وهي "الإدراك، الاستدلال، التخطيط". يعتمد Drive-KD على تقنية التقطير المعرفي (Knowledge Distillation) التي تتيح نقل القدرات بين النماذج، مما يساهم في إنشاء نماذج تدريسية فردية متخصصة تتجاوز الأداء الأساسي.
ومن خلال التركيز على إشارات انتباه محددة لكل طبقة، تم بناء نماذج تدريسية تتمتع بكفاءات فريدة. علاوة على ذلك، تم دمج الإعدادات التدريسية الفردية ضمن إطار عمل متعدد المعلمين من خلال إدخال تقنية الإسقاط الفائق غير المتماثل للتخفيف من نزاعات التدرج المتداخلة.
أثبتت التقييمات الشاملة أن هذه الطريقة تتمتع بقدرة على التعميم عبر عائلات النماذج وأحجامها المتنوعة. أظهرت التجارب أن النموذج المُعتمَد على Drive-KD، InternVL3-1B، يحقق أداءً أفضل بفضل تقليص استخدام الذاكرة بمقدار ~42 مرة وزيادة الإنتاجية بمعدل ~11.4 مرة، متفوقًا على النموذج المدرب مسبقًا (78B) من نفس العائلة على منصة DriveBench، متجاوزًا حتى نموذج GPT-5.1 في بُعد التخطيط.
هذا الإنجاز يسلط الضوء على السبل الجديدة نحو نماذج القيادة الذاتية الفعالة، مما يسهم في تعزيز أمان وكفاءة المركبات ذاتية القيادة.
ثورة جديدة في القيادة الذاتية: تقنيات Drive-KD تعيد تشكيل مستقبل نماذج الرؤية في المركبات
تقديم Drive-KD كإطار عمل مبتكر يعالج التحديات التي تواجه القيادة الذاتية باستخدام تقنيات التقطير المعرفي. يحقق هذا النهج كفاءة أعلى واستخداماً أقل للموارد، مما يمهد الطريق لمستقبل آمن ومستدام للمركبات ذاتية القيادة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
