تعتبر الوعي الفسيولوجي أمراً حيوياً للروبوتات الخدمية والاجتماعية والتي تتفاعل مع البشر في بيئات الحياة اليومية. إحدى التقنيات المبتكرة في هذا المجال هي التصوير الضوئي عن بُعد (Remote Photoplethysmography - rPPG)، والتي تتيح تقدير معدل نبض القلب (Heart Rate - HR) من كاميرا RGB، مما يجعلها خياراً واعداً لأنظمة الرؤية المثبتة على الروبوتات.

ومع ذلك، تبقى تقلبات الإضاءة عائقاً كبيراً أمام نشر هذه التكنولوجيا بفاعلية. وفي ورقة بحثية جديدة، تم تقديم إطار عمل شامل يعتمد على المحولات الزمنية المكانية (Spatial-Temporal Transformer) لتقدير نبض القلب عن بُعد عبر مجموعة بيانات جديدة تتميز بتنوع مستويات الإضاءة.

يتضمن نظام التقدير لدينا تقنيات متقدمة مثل محاذاة الوجه ثلاثية الأبعاد (3D Face Alignment) المعتمدة على PRNet، إضافة إلى تحسين الإضاءة على مستوى المقاطع، ووحدة المعايير الزمنية المتبقية (Residual Temporal Standardization Module).

تجمع الأهداف التدريبية الخاصة بالنموذج بين خسارة موجة Pearson المنحنية (Soft-Shifted Pearson Waveform Loss) وخسارة تباين Kullback-Leibler الطيفي، مع ضبط الوزن ($\mathbf{\beta}$) الذي يتحكم في مساهمة توجيه نبض القلب في مجال التردد.

أظهرت التجارب التي تم إجراؤها على بروتوكول Mix static covering ثلاثة مستويات من الإضاءة أن الوزن $\mathbf{\beta}=5$ قد حقق أفضل النتائج بين جميع الإعدادات المختبرة، حيث سجل خطأ مطلق في نبض القلب (Mean Absolute Error - MAE) قدره 0.79 نقض وأظهر ارتباطاً قوياً بمعدل نبض القلب قدره 0.982.

عند المقارنة مع الأداة الأساسية PhysFormer التي تم تقييمها على مجموعة بياناتنا، تمكن النموذج الجديد من تقليل MAE بمعدل 93.6%، وزيادة معدل الارتباط من 0.088 إلى 0.982، مما يجعله قابلاً للاستخدام في ظروف الإضاءة المتغيرة.

هذا التطور يشير إلى خطوة كبيرة نحو تحسين قدرات الروبوتات في تقديم الخدمة والرعاية الصحية بشكل أكثر فعالية. هل تعتقد أن هذه التكنولوجيا ستغير كيفية تفاعل الروبوتات معنا؟ شاركونا آرائكم في التعليقات!