مع تزايد الاعتماد على نماذج الرؤية واللغة (Vision-Language Models) في استرجاع المعلومات، تُعد عملية تحديث هذه النماذج لمهام الاسترجاع عنصراً أساسياً ولكنه لا يزال غير مستكشف بما فيه الكفاية. الكثير من الأبحاث الحالية تتناول هذا الموضوع من خلال منظور التعلم المستمر القائم على الفئات (Class-Incremental Learning - CIL)، ولكن غالبًا ما تفشل هذه الطرق في تعكس الديناميكيات الخاصة بالاسترجاع.

لتجاوز هذه التحديات، قمنا بتقديم إطار تقييم جديد ومتوازن لاسترجاع المعلومات متعدد الأبعاد (Continual Multimodal Retrieval - CMR). هذا الإطار يُركز على تقييم طرق مختلفة تُستخدم في مجالات بصرية متنوعة.

نتائج تحليلنا التجريبي كشفت أن الطرق التقليدية للتعلم المستمر لا تُحقق النجاحات المطلوبة في سيناريوهاتنا الأكثر تعقيدًا. لذا، نطرح نهجًا مبتكرًا يسمى توجيه المحولات الديناميكي (Dynamic Adapter Routing - DAR). يعتمد هذا النهج على اختيار المحولات من خلال توجيه بناءً على النماذج الأولية، وتم دمجها عبر تقنيات دمج النماذج.

النتائج أظهرت أداءً متفوقًا مقارنة بالأسس السابقة، بالإضافة إلى قدرة قوية على التعميم عند التقييم خارج نطاق التوزيع. هذه النتائج تُبرز التحديات الفريدة لاسترجاع المعلومات المستمر وتفتح آفاقًا جديدة للبحث في هذا المجال.