في عالمنا اليوم، تعتبر نظم مراقبة السائقين المعتمدة على الرؤية أحد أبرز الحلول لزيادة أمان النقل الذكي. ولكن، ماذا لو أخبرتك أن تقييم هذه النظم يعتمد بشكل أساسي على دقة التصنيف فقط؟ هذه النقطة الدقيقة هي ما سلطت عليه دراسة حديثة، حيث أكدت على أن دقة التصنيف ليست كافية لوصف ملاءمة النموذج للاستخدام في العالم الحقيقي.

لتجاوز هذا القيد، تم تقديم إطار عمل جديد يُعرف باسم "إطار التقييم المركز على الإنسان" (Human-Centered Benchmarking Framework) الذي يقيم النماذج عبر أربعة أبعاد حيوية: الدقة، القابلية للتفسير، الكفاءة، والصلابة.

تطبيق هذا الإطار على أربع نماذج معمارية تمثيلية خفيفة، وهي MobileNetV3 وShuffleNetV2 وEfficientNet-B0 وDeiT-Tiny، باستخدام مجموعة بيانات MRL Eye لدراسة حالة العين. على الرغم من أن النماذج بدا وكأنها متساوية في دقة مجموعة البيانات النقية، إلا أن كل نموذج سطع في بُعد واحد بعينه، مما يُظهر أهمية تعدد الأبعاد في التقييم.

ووجدت الدراسة أن نموذج ShuffleNetV2 يُحقق المركز الأول عبر جميع السيناريوهات الموجهة نحو النشر، لكن مع ذلك، احتفظ أقل من نصف أدائه تحت ضوضاء المستشعر، حيث فشل في تصنيف العيون المغلقة على أنها مفتوحة، بينما أظهر النموذج المتحول (Transformer) صلابة أكبر.

تسلط هذه النتائج الضوء على أن الترتيب العام قد يُخفي نقاط ضعف محددة في الأبعاد التي يمكن أن تكون حاسمة في العمليات التشغيلية، مما يبرز القيمة الحقيقية للتقييم المتعدد الأبعاد الذي يضع الإنسان في المركز.

تابعونا لاستكشاف كيف يمكن أن تُساعد مثل هذه المعايير في تحسين أنظمة النقل الذكي وجعلها أكثر أماناً وفاعلية!