تُعتبر التعرف على التعبيرات الدقيقة (Micro-expression Recognition) واحدة من أكبر التحديات في علم الحاسوب والتفاعل بين البشر والآلات، وذلك بسبب حركات العضلات الوجهية الدقيقة والسريعة التي يصعب رصدها. ومع اعتماد الأساليب الحالية على الأطر الزمنية الافتتاحية، تفوت هذه الأساليب الديناميكيات الدقيقة بين الإطارات، مما يُقيد إمكانية تعميمها عبر مجموعات البيانات المتعددة.

لحل هذه التحديات، تم تقديم النموذج الجديد المعروف باسم STAG (Spatio-temporal Evolving Structural Representation of Action Units). يستخدم هذا النظام شبكة ديناميكية تربط بين مناطق الاهتمام (ROI) لوحدات الحركة (AU)، ويقوم بنمذجة تدفق الحركة والتواصل الديناميكي للوجه بشكل متكامل. يعتمد الإطار على استخراج التدفق الضوئي من الإطارات المحددة باستخدام اختيار قائم على الحجم والانتباه الزمني.

تجمع الهندسة المعمارية ذات الفرعين بين شبكة انتباه بيانية محسّنة لتحليل التخطيط المكاني مع نموذج المحول (Transformer) الذي يركز على النمذجة الزمنية. تُتيح وحدة الانتباه العابر ثنائية الاتجاه تحسينًا متبادلاً للميزات المكانية والزمنية، بينما تتكيف تفاعلات مناطق الوجه استنادًا إلى أنماط نشاط العضلات.

يساهم المحول في التقاط الديناميات الزمنية الدقيقة، مما يُحسن من الاتساق الدلالي وقابلية التفسير لنظام تعرف التعبيرات الدقيقة. يتم تحسين التمثيل المدمج باستخدام خسارة بؤرية (Focal Loss)، ويُقيّم النظام على مجموعات بيانات مثل CASME II و4DME وDFME وNaME وSAMM وSMIC-HS.

تظهر النتائج التجريبية الواسعة تحسينات كبيرة في المتانة، والتعميم، وقابلية التفسير، والكفاءة الحسابية، مما يثبت فعالية التفكير الرمانی المتكيف، والتواصل الديناميكي الموجه بوحدات الحركة، ودمج الميزات الزمنية والمكانية العميقة لتحقيق تعرف دقيق للتعبيرات الدقيقة عبر مجموعات البيانات المختلفة.