في عالم الذكاء الاصطناعي، يُعد تقدير حركة اليد المزدوجة من مقاطع [الفيديو](/tag/الفيديو) الذاتية (Egocentric Video) خطوة أساسية لمراقبة [تعلم](/tag/تعلم) [السياسات](/tag/السياسات) التحكمية للروبوتات. لكن، هذه المهمة تصطدم بعدد من التحديات الكبيرة، منها أن اليدين غالباً ما تخرج من نطاق الكاميرا بسبب حركة الرأس، إضافة إلى تداخل الأجسام الذي يتسبب في حدوث انسدادات تؤثر على [دقة](/tag/دقة) التقدير.
مؤخراً، تم تقديم [نموذج](/tag/نموذج) يدعى StableHand، والذي يعتمد على فكرة رئيسية تقضي بأن [دقة](/tag/دقة) تقدير حركة اليد مرتبطة ارتباطاً وثيقاً بجودة ملاحظات حركة اليد في كل إطار. من خلال هذا النظام، يتم [تحليل](/tag/تحليل) جودة حركة اليد المستخلصة من مُقدِّر وضع اليد (Hand Pose Estimator) العادي إلى أربع [قنوات](/tag/قنوات) مختلفة تشمل [الحركة](/tag/الحركة) العالمية للمعصم (Wrist Global [Translation](/tag/translation)) والتقنيات الإصبعية (Finger Articulations) لكلا اليدين.
النموذج StableHand يمثل إطار [عمل](/tag/عمل) متطور يعتمد على الجودة، حيث يتم استخدام [إشارات](/tag/إشارات) الجودة في عملية مطابقة [الحركة](/tag/الحركة). من خلال [استراتيجيات](/tag/استراتيجيات) متقدمة مثل [جدولة](/tag/جدولة) تقدم لكل قناة، وضبط [سرعة](/tag/سرعة) الهدف وفقاً للجودة، ضمن عملية [تحسين تدفق](/tag/[تحسين](/tag/تحسين)-تدفق) الحركة، يتمكن النموذج من الحفاظ على ملاحظات ذات جودة عالية وإعادة [بناء](/tag/بناء) الملاحظات غير الموثوقة باستخدام سابقة حركة ثنائية اليد متعلمة.
أثبتت [التجارب](/tag/التجارب) على مجموعتي [بيانات](/tag/بيانات) HOT3D و ARCTIC - اللتين تتضمنان مقاطع [فيديو](/tag/فيديو) ذات انقطاع طويل ليد واحدة وتداخل مستمر بين اليدين والأجسام - أن StableHand يتجاوز الحلول السابقة، حيث يخفض معدل W-MPJPE بنسبة تتراوح بين 20% إلى 25%، مما يجعل من النموذج جديداً بارزاً في هذا المجال.
StableHand: الثقة في تقدير حركات اليد المزدوجة من مقاطع الفيديو الذاتية
تطوير نظام StableHand يمكنه استعادة حركات اليد بدقة عالية من مقاطع الفيديو الذاتية. يساهم هذا الابتكار في تحسين تعلم السياسات التحكمية للروبوتات، ويتجاوز التحديات التقليدية في هذه المهمة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
