في عالم التفاعل بين الإنسان والحاسوب، يمثل التعرف على حركات اليد الديناميكية في الوقت الحقيقي تحدياً كبيراً. يواجه هذا النوع من التفاعل حقيقة تمثيل الحركات المختلفة بين الأفراد، مما يعقد من عملية التعرف عليها بدقة وسرعة. ولكن، تم تطوير نظام مبتكر يعتمد على الشبكات العصبية التلافيفية ثلاثية الأبعاد (3D Convolutional Neural Networks) لتجاوز هذه التحديات.

نظام التعرف على حركات اليد الجديد قادر على تحديد موقع الحركات في مجرى فيديو حقيقي والتعرف على نوعية هذه الحركات في الوقت الفعلي. ولتحسين موثوقية النظام، تم استخدام تقنية النافذة المنزلقة (sliding window) لتدقيق النتائج المستخلصة من عدة نوافذ عرض.

تم تدريب النماذج المستخدمة في المشروع على قاعدة بيانات Jester، وحقق النظام نسبة دقة عالية تتجاوز 98% في التعرف على الحركات و90% في تصنيفها. في الأداء العام للنظام، يستطيع أفضل مجموعة من المتطوعين الاستجابة خلال ثلاث ثوانٍ فقط، مع الوصول إلى دقة Levenshtein بنسبة 37.5% في مجموعة البيانات الخاصة بالمشروع.

تُعد الأكواد المستخدمة في هذا المشروع متاحة للجمهور، مما يتيح للباحثين والمطورين تجربة النظام وتحسينه.

ما رأيكم في هذا التطور التكنولوجي؟ كيف تتخيلون استخدامات مستقبلية لمثل هذه الأنظمة؟ شاركونا في التعليقات.