في خطوة جديدة نحو تحقيق حلم القيادة الذاتية، يقدم الباحثون نموذجاً مبتكراً للذكاء الاصطناعي يستهدف تحسين قدرات السيارات على فهم البيئة المحيطة بها. هذا النموذج يستخدم أساليب متقدمة في التعلم العميق متعددة المهام، مما يسمح له بأداء عدة وظائف في وقت واحد مثل تقسيم الصور (semantic segmentation) وتقدير العمق (depth estimation)، بالإضافة إلى معالجة بيانات أنظمة تعيين المسافات بالليزر (LiDAR).

تتمثل أهم ما يميز هذا النموذج في قدرته على تكامل المعلومات من عدة حساسات منفصلة، بما في ذلك كاميرات RGB والحساسات البصرية الديناميكية (Dynamic Vision Sensors) والـ LiDAR، مما يمنح السيارة فهماً أقوى وأدق للأماكن التي تتحرك فيها. يقوم هذا النموذج أيضاً باستخدام خوارزمية لتوازن الخسارة (adaptive loss weighting) للتصدي لمشكلة عدم التوازن في التعلم نتيجة لتعدد المهام.

عند إجراء دراسات مقارنة، أظهر النموذج أداءً يفوق الكثير من النماذج السابقة بينما يستخدم عدد أقل من المعاملات (parameters)، مما يعني أنه يمكنه الاستدلال بصورة أسرع وباستخدام ذاكرة GPU أقل. كما أثبت النموذج فعاليته في العمل مع مجموعات بيانات محاكاة متعددة وكذلك مع بيانات من العالم الحقيقي، مما يعزز إمكانية استخدامه في التطبيقات المستقبلية.

لمن يرغب في الاستزادة، يمكنه الاطلاع على الكود والملفات المتعلقة بهذا البحث عبر الرابط المتاح.