تتقدم تكنولوجيا القيادة الذاتية (Autonomous Driving) بشكل سريع بفضل تدخل نماذج اللغة والرؤية (Vision-Language Models - VLMs) التي تقدم إمكانية التفكير بطريقة قريبة من البشر. لكن ما تزال هناك فجوات كبيرة بين ما هو متاح من هذه النماذج والتطبيقات الفعلية للقيادة الذاتية.
أحد أبرز التحديات هو أن البيانات المستخدمة حاليًا تحتوي على أوصاف لغوية غير منسقة، مما لا يجعلها صديقة للآلة، ويؤدي هذا إلى تكرار المعلومات. علاوة على ذلك، يتطلب تنفيذ نماذج VLMs الحالية طاقة حسابية ضخمة، مما يؤثر سلبًا على سرعة الاستنتاج والقدرة على التطبيق في العالم الواقعي.
للتغلب على هذه التحديات، يقدم البحث الجديد نموذجًا منظمًا يسمى NuScenes-S، وهو مجموعة بيانات قائمة على نموذج NuScenes، والذي يحتوي على تمثيلات هيكلية صديقة للآلة.
كما يمهد النموذج الجديد FastDrive الطريق مع بنية بسيطة تتكون من 0.9 مليار معلمة، حيث يستطيع فهم الأوصاف الهيكلية وبسرعة عالية. مقارنةً بالنماذج الأخرى التي تحتوي على أكثر من 7 مليارات معلمة مثل LLaVA-1.5، يظهر FastDrive تفوقًا في سرعة الاستنتاج بأكثر من 10 مرات، مع تحسين نسبة دقة تصل إلى 20% في مهام اتخاذ القرار.
تتضمن الدراسات الإضافية تأثير تعليمات المشهد مثل حالة الطقس والوقت على القرارات المتخذة، مما يثبت أهمية التفاصيل الصغيرة في نجاح القيادة الذاتية. تعد هذه النتائج خطوة هامة نحو تحقيق تطبيقات واقعية أكثر فعالية للقيادة الذاتية في المستقبل.
نموذج جديد يعزز تطوير القيادة الذاتية بكفاءة مذهلة!
يقدم نموذج FastDrive تطورًا كبيرًا في تقنيات القيادة الذاتية من خلال معالجة اللغة والرؤية بكفاءة. هذا الابتكار يعد خطوة هامة نحو تطبيقات القيادة الذاتية في العالم الحقيقي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←# القيادة الذاتية# رؤية ولغة# ذكاء اصطناعي# نموذج FastDrive# نماذج لغة ورؤية# تقنيات حديثة# الذكاء الاصطناعي# التحليل البياني
جاري تحميل التفاعلات...
