في عالم الروبوتات، تعتبر القدرة على تنفيذ المهام بدقة عالية أمراً مهماً للغاية. تعتمد هذه القدرة على التوازن بين التخطيط الاستراتيجي عالي المستوى والتحكم الدقيق في حركات الأصابع. وفي دراسة حديثة نُشرت على arXiv، تم تقديم أسلوب مبتكر يجمع بين هذين العنصرين.

تظهر النماذج الضخمة القائمة على الرؤية واللغة (Vision-Language-Action Models) قدرة ملحوظة على التخطيط البعيد المدى للمهام المعقدة، ولكن غالباً ما تقتصر على استخدام أدوات مخصصة مثل الملقط (pincher grippers). بالمقابل، تبرز سياسات تعلم التقليد (Imitation Learning) في الأداء الفائق للمهام المتقنة باستخدام أدوات ذات درجات حرية أعلى (Higher Degree-of-Freedom Grippers)، لكن عادة ما تكون فعالية هذه الأنظمة محدودة بنطاق معين من المهام.

تقوم الطريقة الجديدة على فكرة قنوات التحكم متعددة، حيث تجمع بين نماذج VLA المتقدمة ونماذج تحكم أصغر، مما يمكن الروبوتات من إجراء عمليات تحكم أكثر مرونة ودقة. يرتكز هذا النظام على آلية تبديل مدفوعة بالأحداث تتابع تقدم المهام الفرعية، مع الاستفادة من بيانات تجريبية محدودة عن طريق ضبط نموذج VLA لتوقع إشارات الأحداث.

تطبيق هذا الأسلوب على يد روبوتية إنسانية ذات ثلاث عشرة درجة حرية يظهر إمكانياته المتعددة. حيث يمكن تعديل المرونة (Compliance) لتقييم تأثيرها على دقة الأداء وثبات الاتصال أثناء تنفيذ المهام. تم إثبات فعالية هذا المنهج عبر مهام متعددة تعتمد على لغة معنية.

بالإضافة إلى ذلك، تتيح هذه الطريقة إمكانية التكيف مع مهارات متقنة إضافية وأيدٍ متوافقة مختلفة دون الحاجة لإعادة تدريب نموذج VLA، مما يعطيها ميزة التوسع الفعّال في الأداء.

في الختام، تعكس هذه الدراسة التطورات الرائعة في مجال الروبوتات، حيث يمكن استفادة الأنظمة من الذكاء الاصطناعي والمرونة الجسدية لتحقيق أداء متفوق في المهام المعقدة.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.