تعتبر تقديرات وضعيات الإنسان أحد التحديات المهمة في مجالات الذكاء الاصطناعي ورؤية الكمبيوتر، حيث تطورت الأساليب بشكل كبير في السنوات الأخيرة. لكن الآن، يبدو أن هناك ثورة جديدة في هذا المجال مع تقديم تقنية MAEPose، والتي تعتمد على تقنية التعلم الذاتي لتقدير وضعيات الإنسان باستخدام فيديوهات الموجات المليمترية (mmWave).

تتميز تقنية MAEPose بأنها توفر بديلاً يحافظ على الخصوصية مقارنة بأساليب تقدير الوضعيات التقليدية التي تعتمد على الكاميرات البصرية (RGB). في الطريقة التقليدية، عادةً ما يتم استخدام تمثيلات وسيطة مستخرجة مسبقاً مثل السحب النقطية أو صور الطيف، حيث يتم تجاهل المعلومات الغنية المكانية والزمانية المتوفرة في فيديوهات الموجات المليمترية. لكن MAEPose تتخطى هذه القيود، حيث يتم تدريبها على بيانات الفيديو غير المعلّمة مباشرةً.

تعتمد MAEPose على تقنية الترميز الذاتي المMasked Autoencoding لتقدير وضعيات الإنسان، حيث تتعلم من الفيديوهات غير المعلّمة لتحصل على تمثيلات عامة للمعلومات الحركية المكانية والزمانية. بالإضافة إلى ذلك، تستخدم MAEPose وحدة فك تشفير خرائط الحرارة (heatmap decoder) لتقديم توقعات دقيقة لوضعيات الإنسان عبر مقاطع متعددة.

خضعت MAEPose للاختبار عبر ثلاث مجموعات بيانات باستخدام تقنيات تترك شخصًا واحدًا خارج الاختبار مع تحليل إحصائي صارم، وأظهرت تفوقها على الطرق التقليدية بنسبة تصل إلى 22.1% في معيار MPJPE مع قيمة p<0.05. وبتفاعل موثوق تحت ظروف عدم وجود تدخل من الأشخاص الآخرين، زادت نسبة الخطأ بمقدار 6.5% فقط.

عند إجراء دراسات الانحدار، كانت النتائج واضحة بأن كلاً من التدريب المسبق ووحدة فك تشفير خرائط الحرارة لهما تأثير كبير على دقة النتائج. كما تشير تحليلات النماذج إلى أن استخدام فيديو نطاق دوبلر (Range-Doppler) كمدخلات يحقق أداءً أفضل في تقدير الوضعيات مقارنة بأساليب أخرى، بالإضافة إلى أنه يتطلب موارد حسابية أقل.

مع هذا التطور المذهل، يُظهر MAEPose كيف يمكن لتقنيات الموجات المليمترية أن تلعب دورًا محوريًا في تحديث طرق تقدير وضعيات الإنسان، مما يبشر بمستقبل مشرق في هذا المجال.