في عالم متسارع وتزداد فيه حوادث الطرق، تأتي أهمية تطوير تقنيات التعرف على السلوكيات الخطرة للسائقين من خلال الفيديوهات الملتقطة داخل المركبات. يُعتبر التعرف على هذه السلوكيات أحد أسس تعزيز السلامة على الطرق ودعم رصد المخالفات المرورية. وللتغلب على التحديات المرتبطة بدقة تحديد مواقع الأحداث والزمن، قدم الباحثون إطار عمل متقدم يُعرف باسم "إطار العمل الثنائي المرحلة".

هذا الإطار مصمم خصيصًا لمراقبة سلوكيات السائقين، مع التركيز على إعدادات الفحص الدوري مثل نقاط سلامة النقل أو تقييم إدارة الأساطيل. يعتمد هذا النظام على منهجية ذات مرحلتين تبدأ باستخراج الميزات باستخدام نموذج VideoMAE، تليها عملية الكشف المعززة من خلال "Augmented Self-Mask Attention" (AMA) مدعومة بوحدة "Spatial Pyramid Pooling-Fast" (SPPF) لالتقاط ميزات زمنية متعددة المقاييس.

أظهرت النتائج التجريبية مفارقة واضحة بين قدرة النموذج وكفاءته، حيث كانت دقة نموذج "ViT-Giant" في مرحلة استخراج الميزات 88.09%، ولكن كان هناك بديل أكثر عملية هو النموذج القائم على "ViT" الذي حقق دقة 82.55% بتكاليف أقل بكثير من ناحية الحسابات.

في مهمة التحديد اللاحقة، كان تكامل SPPF يحسن من الأداء عبر جميع الإعدادات. ومن المثير للاهتمام، أن نموذج "ViT-Giant + SPPF" بلغ أعلى مستوى من المقياس المتوسط الدقيق (mAP) بنسبة 92.67%، بينما حافظت التهيئة الخفيفة القائم على "ViT" على نتائج قوية.

يجسد هذا العمل التقدم المبهر في مجال الأمان على الطرق ويمنحنا رؤية جديدة لكيفية استخدام الذكاء الاصطناعي لتقليل حوادث السير. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.