تظهر نماذج الرؤية-اللغة-العمل (VLA) كنموذج أساسي للجسد في روبوتات التحكم، لكن استخدامها يحمل تحديًا جديدًا يتعلق بالنسيان. يتمثل هذا التحدي في ضرورة إزالة السلوكيات غير الآمنة أو غير المرغوب فيها أو التي تتعلق بالخصوصية، دون التأثير على الأداء في مجالات الإدراك وتجذير اللغة والتحكم في الحركة.

تبرز السياسات المعتمدة على OpenVLA كيفية إنتاج السلوك عبر معالج بصري مدمج، وجهاز عرض متعدد الوسائط، وهيكل لغوي يتنبأ بإجراءات الروبوت المُشفرّة. تتمثل المشكلة في أن المعرفة غير المرغوب فيها قد تنتشر عبر طبقات الإدراك والمحاذاة والتفكير/الإجراء، بدلاً من تقييدها في وحدة واحدة. وبالتالي، قد يكون تطبيق عملية نسيان جزئي على نموذج الرؤية أو على الهيكل اللغوي غير كافٍ.

نعرض الآن VLA-Forget، وهو إطار نسيان هجين يجمع بين تحرير انتقائي مدرك للنسبة من أجل الإدراك وتحديدات محددة متعددة الوسائط، مع نسيان انتقائي خاص بالطبقات من أجل الحفاظ على الأداء. يهدف VLA-Forget إلى تحسين ثلاثة أهداف، وهي: النسيان المستهدف، والحفاظ على الإدراك، واحتفاظ التفكير، من خلال تحديثات منسقة على المعالج البصري وجهاز العرض وكتل المولد العلوي.

من خلال تقييمات لنماذج السلوك المعني ونماذج النجاح في المهام، أظهر VLA-Forget تحسينات تصل إلى 10% في كفاءة النسيان، و22% في الحفاظ على الخصوصية الإدراكية، و9% في احتفاظ التفكير ونجاح المهام، بالإضافة إلى تقليص الانتعاش بعد التكميم بنسبة 55% مقارنةً بمعايير النسيان القوية.

إن التطورات في هذا المجال تفتح آفاقًا جديدة لتطبيقات الذكاء الاصطناعي في الروبوتات. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.