تشهد نماذج الرؤية-اللغة-الإجراء (Vision-Language-Action) إنجازات ملحوظة في القدرة على تنفيذ المهام الروبوتية بشكل عام، إلا أنها لا تزال تواجه تحديات كبيرة عندما تتطلب هذه المهام نقل الخبرات في ظل ظروف جديدة. في هذا السياق، يبرز VLA-Pro كإطار مبتكر يُعزز من قدرة الروبوتات على التكيف السريع مع المهام غير المعروفة.

يعمل VLA-Pro كحل متكامل ومنفصل، حيث يُخزن الذاكرة الإجرائية المرتبطة بالمهام أثناء فترة التدريب، ليتم استرجاعها واستخدامها خلال مرحلة الاستدلال. يميز هذا الإطار نفسه من خلال تخزين محولات LoRA الخاصة بكل مهمة كذكريات إجرائية مُعَلمة. وعند الحاجة، يقوم VLA-Pro باسترجاع هذه الذكريات ذات الصلة بناءً على السياق المتعدد الوسائط الحالي، مما يُمكنه من دمجها ديناميكيًا لإنتاج استجابة دقيقة.

تجارب أجريت على منصات RoboTwin وRLBench، بالإضافة إلى تطبيقات حقيقية، أظهرت أن VLA-Pro يحقق تحسينات كبيرة جداً في القدرة على التكيف مع مهام جديدة، حيث يصل معدل التحسين إلى 207% في البيئات المحاكية، ويرتفع معدل النجاح في العالم الحقيقي من 5.8% إلى 65.0%. هذه النتائج تشير إلى أن استرجاع الذاكرة الإجرائية وتكيفها يمثلان آلية فعالة لنقل خبرات التلاعب إلى مهام جديدة، مع الحفاظ على المرونة والثبات في التنفيذ.

في عصر يسعى فيه الذكاء الاصطناعي إلى تحسين الأداء والسلاسة في الأعمال، تعكس هذه الابتكارات الدور الكبير الذي تلعبه الذاكرة الإجرائية في دفع حدود الروبوتات إلى مستويات جديدة من الكفاءة والتعامل مع تعقيدات العالم الحقيقي.