في عالم الذكاء الاصطناعي المتسارع، تلعب أنظمة التعرف على الأنشطة (Activity Recognition) دوراً محورياً في فهم سلوكيات الأفراد من منظورهم المباشر. ومن بين التطورات المبهرة، يبرز نظام MAND، وهو إطار متطور للتعرف على الأنشطة في بيئات مفتوحة، يقوم على دمج الأنماط البصرية والحركية لتحقيق فهم دقيق للسلوكيات.

تمتاز أنظمة التعرف التقليدية بمدى فعاليتها في بيئات مألوفة، ولكنها تخفق غالباً في التعرف على الأنشطة الجديدة عند التعامل مع بيانات متغيرة باستمرار. تعتمد الطرق المتاحة حالياً على استخدام مؤشرات موحدة لتسعير النشاطات الجديدة، مما يترك مجالاً كبيراً لاستغلال المعلومات الموجودة في أنماط البيانات الفردية.

يأتي دور MAND كحل مبتكر، حيث يطبق آلية متقدمة تُعرف باسم Modality-aware Adaptive Scoring (MoAS). تعمل هذه الآلية على ضبط مساهمة كل نمط ديناميكياً استنادًا إلى موثوقية العينات، مما يُحسن من دقة تصنيف الأنشطة الجديدة.

وعلاوة على ذلك، خلال فترة التدريب، يستخدم النظام تقنية Modality-aware Representation Stabilization Training (MoRST) للحفاظ على القدرة التمييزية لكل نمط عبر المهام المختلفة. وهذا يضمن عدم تعرض المعلومات القيمة من كل نمط للنسيان الكارثي.

أظهرت التجارب على معايير متعددة الأنماط المعلنة قدرة MAND على تحسين دقة اكتشاف الأنشطة الجديدة بشكل ملحوظ، مع تقليل معدل الأخطاء في التعرف على الأنشطة المعروفة، مما يدل على فعاليته في تطبيقات العالم المفتوح.

يدعوكم فريق البحث لاستكشاف الرمز المصدر الخاص بالنظام عبر هذا الرابط: [github.com/HyeJeongIm/MAND].

ما رأيكم في هذه التقنية الثورية؟ هل تعتقدون أنها ستحدث تغييراً في مستقبل التعرف على الأنشطة؟ شاركونا آرائكم في التعليقات!