تسعى تقنيات القيادة الذاتية إلى تحقيق فهم شامل للمشاهد المرورية والتنبؤ بالنوايا السائقية، مما يتطلب نماذج تعتمد على المعلومات المتعددة من الرؤية واللغة. ولكن، لا يزال هناك تحدٍ يتمثل في ما يُعرف بالتبادل المركب (coupling trade-off) بين نماذج الرؤية واللغة (vision-language models) وتخطيط الحركة (trajectory prediction).
في هذا السياق، تظهر تقنية VECTOR-Drive كحل مبتكر، حيث توفر إطار عمل متكامل يعتمد على نموذج Qwen2.5-VL-3B. تضمن التقنية الحفاظ على الربط بين جميع الرموز من خلال الانتباه الذاتي المشترك (shared self attention)، مع توجيه الحسابات بناءً على دلالات الرموز.
تعمل الرموز الخاصة بالرؤية واللغة عبر خبير خاص بالرؤية واللغة (Vision-Language Expert) للحفاظ على المعلومات الدلالية، بينما يتم توجيه الرموز الخاصة بالنقاط المستهدفة وحالة السيارة والقيام الضبابي إلى خبير المسار (Trajectory Expert) لعمليات حساب خاصة بالحركة. يجسد المسار الناتج عن الرموز الحركية تخطيطاً يتطابق مع التدفقات، مما يحسن المخرجات النهائية مثل النقاط المستقبلية ونماذج السرعة.
قد حقق VECTOR-Drive أداءً مبهراً في اختبار Bench2Drive، حيث سجل 88.91 في نقاط القيادة، متفوقاً على عدة نماذج معروفة تستخدم تقنيات القيادة الذاتية. وتوضح النتائج كيفية تحسين الأداء من خلال الانتباه المشترك وتوجيه الخبراء القائم على المعرفة الدلالية.
إن التطورات التي يقدمها VECTOR-Drive وتمثل قفزة نوعية في عالم القيادة الذاتية مما يمنح المستخدمين أماناً وراحة أكبر أثناء القيادة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
VECTOR-Drive: ابتكار ثوري في القيادة الذاتية عبر دمج الرؤية واللغة والخبراء في تخطيط المسار
نقدم لكم VECTOR-Drive، الابتكار الرائد في تقنيات القيادة الذاتية، الذي يعزز من كفاءة فهم المشاهد المرورية وتخطيط الحركة. تعرفوا على كيفية دمج الرؤية واللغة لتحسين تجربة القيادة الذاتية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
