في عالم الذكاء الاصطناعي، تتطلب عادةً التغيرات في نماذج رؤية اللغة (Vision-Language-Action Models) أدوات وتدريبات محددة للمهام الجديدة، مما قد يجعل عملية التكيف مكلفة من حيث جمع البيانات واستهلاك الموارد. لكن ما الجديد في هذا المجال؟

في ورقة بحثية جديدة، يكشف الباحثون أن التحصيل (Retrieval) يمكن أن يكون بديلاً فعّالًا عن إعادة تدريب النماذج لتسهيل التكيف مع المهام الجديدة. بدلاً من إعادة التدريب على تجارب جديدة، يقوم الباحثون بتدريب سياسة تعتمد على التحصيل مرة واحدة، باستخدام تجارب مرتبطة بشكل مباشر مع الهدف (query) وتجارب أرخص من جهة أخرى (pool)، مثل مقاطع الفيديو التي تُظهر أيدٍ بشرية.

تتيح هذه المنهجية إضافة مهام جديدة في مرحلة النشر عن طريق إضافة تجارب جديدة إلى مجموعة التحصيل، مما يجعل النظام أكثر مرونة. يُظهر البحث أن استخدام التحصيل يعزز من أداء النماذج أكثر من مجرد الاعتماد على معايير محددة، ووُجد تأثير ملحوظ بشكل خاص في نموذج سياسي يسمى Cosmos، الذي يعتمد على توليد الفيديو وهو نموذج يعمل على الأنشطة العالمية.

من خلال التجريب، تبين أن التحصيل يوفر تقدماً粗 في المهام، بينما يسهم الهدف البصري للنموذج في تعزيز التنظيم البصري للأفعال المستندة إلى التحصيل. كما أظهرت النتائج أن هذه الطريقة تحقق أداءً متفوقاً عند التجريب على مهام غير مألوفة، مع إمكانية التجربة على روبوت حقيقي.

الحاجة إلى إعادة ضبط المعلمات تكون واردة فقط عند التوجه لمهام جديدة غير مألوفة، مما يجعلها أكثر سهولة وفعالية. هل سيسهم هذا النظام في تحسين تجارب الذكاء الاصطناعي في المستقبل؟