تظل تجزئة المشاهد الطرقية بشكل فعّال تحت ظروف الإضاءة السيئة، مثل الظلال وظروف الإضاءة المتغيرة، تحديًا رئيسيًا لصناعة القيادة الذاتية. يمثل دمج الصور بالألوان RGB مع البيانات الحرارية (RGB-Thermal fusion) إحدى الطرق القياسية المتبعة، لكن الطرق الحالية تعاني من تطبيق استراتيجيات دمج ثابتة، مما يسمح بتراكم الضوضاء الخاصة بكل نمط من أنماط البيانات.

في هذا السياق، يبرز الابتكار الجديد المعروف باسم CLARITY، الذي يقدم استراتيجية دمج ديناميكية تعتمد على ظروف المشهد المكتشفة. يستخدم هذا الإطار المتقدم نماذج الكلمات والرؤية (Vision-Language Model) لتوجيه كيفية تعديل مساهمة كل نمط في البيانات بناءً على حالة الإضاءة، مما يضمن عدم فقدان المعلومات الهامة حول الكائنات.

بالإضافة إلى ذلك، تمت إضافة آليتين مبتكرتين: الأولى تحتفظ بدلالات الكائنات في البيئات المظلمة، وهو ما تتجاهله غالبًا طرق تقليل الضوضاء التقليدية. الثانية هي وحدة فك تشفير هرمية تعزز الاتساق الهيكلي عبر المقاييس، مما يساعد على تحديد حدود الكائنات الرقيقة بدقة أكبر.

أظهرت التجارب التي أجريت على مجموعة بيانات MFNet أن CLARITY قد حقق مستويات جديدة من التميز بمعدل تداخل المعيار (mIoU) يصل إلى 62.3% ودقة المعيار (mAcc) تبلغ 77.5%، مما يجعله الخيار الأمثل لتطبيقات القيادة الذاتية.

متطلبات الابتكار معروفة، والآن يمكننا النظر إلى كيفية تحسن قدرتنا على قيادة المركبات تلقائيًا في ظروف صعبة دون عناء. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.