تتسارع وتيرة الابتكارات في مجال القيادة الذاتية، حيث تمثل تقنية DVGT-2 (Driving Visual Geometry Transformer 2) نقلة نوعية في هذا المجال. في السابق، كانت نماذج القيادة الذاتية تعتمد على أساليب تقليدية تفتقر إلى الوعي المكاني الدقيق، لكنها الآن تتجه نحو نموذج جديد يحمل اسم Vision-Geometry-Action (VGA)، الذي يركز على هندسة ثلاثية الأبعاد كثيفة كجزء أساسي من عملية اتخاذ القرار. يعد هذا النموذج أكثر فعالية لأنه يتفاعل مع البيئة ثلاثية الأبعاد التي تعمل فيها السيارات، مما يمنحها معلومات أعمق وأكثر شمولية.
تواجه معظم الطرق التقليدية المعتمدة على إعادة بناء الهندسة ثلاثية الأبعاد تحديات في معالجة البيانات بشكل فعال. وفي هذا السياق، يأتي نموذج DVGT-2 ليعمل في بيئة الإنترنت الفورية، حيث يتيح معالجة المدخلات بشكل متزامن ويقوم بإخراج معلومات هندسية كثيفة وتخطيط المسار في الوقت الفعلي. يعتمد هذا النموذج على تقنية الانتباه الزمني (temporal causal attention) ويستخدم ذاكرات تاريخية لدعم الاستنتاج السريع.
ولتسهيل عملية المعالجة، تم إدخال استراتيجية التدفق الانزلاقي، مما يمكّن من تجنب التكرار في العمليات الحسابية ويعزز من سرعة الأداء. وبفضل هذه التحسينات، لم يساعد DVGT-2 فقط في تحسين سرعة معالجة البيانات، بل أثبت أيضًا تفوقه في إعادة بناء الهندسة على مجموعة متنوعة من مجموعات البيانات.
الأهم من ذلك، يمكن تطبيق نفس نموذج DVGT-2 المدرب مباشرة على التخطيط عبر مختلف تكوينات الكاميرات دون الحاجة إلى ضبط دقيق، مما يجعله أداة مرنة وفعالة في بيئات القيادة المشتركة، مثل تجارب NAVSIM والنماذج المفتوحة مثل nuScenes.
DVGT-2: نموذج ثوري للقيادة الذاتية يعتمد على الرؤية والهندسة
تقنية القيادة الذاتية تتطور مع تقديم نموذج DVGT-2 الذي يعتمد على هندسة ثلاثية الأبعاد كثيفة كمدخل أساسي. هذه التقنية الجديدة تعد بتوفير قرارات دقيقة وفورية أثناء القيادة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
