يواجه تعلم السياسات الحركية المرئية (visuomotor policies) تحديات كبيرة، خاصةً عندما تكون حالات الخبراء المعتمدة قليلة. ومن أبرز هذه التحديات هو كيفية تحويل تمثيلات RGB ذات الأبعاد العالية إلى هندسة تسهم في التحكم دون الوقوع في مشكلة الإفراط في التدريب.
في هذا السياق، قدمت الأبحاث تقنية جديدة تُعرف باسم "إعادة التدريب بالنقاط المرجعية الهندسية" (Geometric Anchor Pre-training - GAP). تهدف هذه التقنية إلى تحسين كفاءة استخدام البيانات من خلال مرحلة تحضيرية بسيطة تُعرف بأنها خالية من الإجراءات، تُساعد في تنظيم وحدة التجميع المكاني قبل بدء عملية التعلم.
يعتمد أسلوب GAP على مساعدة الخوارزمية على التعرف على كائنات معينة خلال مهام محاكاة خفيفة، مما يساعد على إنتاج نقاط مرجعية هندسية مستقرة. تعتمد فكرته على استخدام قناع الكائنات المتاح بدون تكلفة لزيادة دقة وحدة التجميع.
عند التجريب، أظهرت التقنية الجديدة قدراتها على التفوق في ظروف ندرة البيانات وكذلك التحول في المجالات، حيث حققت نجاحًا بنسبة 62% في مهمة RoboMimic Can مع 15 عرضًا، و63% في مهمة Tool Hang مع 50 عرضًا، و61% في مهمة ManiSkill StackCube مع 30 عرضًا.
تعتبر المرحلة التجريبية خفيفة الوزن وقابلة لإعادة الاستخدام عبر البيئات المختلفة ومهارات المعالجة، ما يجعلها خطوة واعدة نحو تحقيق تحسينات كبيرة في التعلم الآلي للروبوتات.
في النهاية، يُظهر أسلوب GAP إمكانية تحويل مشهد التعلم الحركي بشكل جذري ويعزز من كفاءة الروبوتات في أداء المهام بطريقة متميزة دون الاعتماد المفرط على بيانات ضخمة.
ثورة في التعلم المرئي الحركي: أسلوب GAP يعزز كفاءة الروبوتات!
طرحت الأبحاث الأخيرة أسلوب GAP لإعادة تدريب الروبوتات بطريقة جديدة وفعّالة باستخدام بيانات محدودة. هذا التطور يُعدّ خطوة مبتكرة نحو تحسين القدرة على التعلم الحركي في المهام المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
