في عالم الذكاء الاصطناعي، تظل مشكلة النسيان الكارثي (Catastrophic Forgetting) أحد أكبر التحديات التي تواجه [نماذج التعلم](/tag/[نماذج](/tag/نماذج)-[التعلم](/tag/التعلم)) المستمر، خصوصًا في [النماذج اللغوية الكبيرة](/tag/[النماذج](/tag/النماذج)-اللغوية-الكبيرة) ([LLMs](/tag/llms)) ونماذج [الرؤية](/tag/الرؤية)-[اللغة](/tag/اللغة) ([VLMs](/tag/vlms)). رغم أن الهياكل المبنية على خليط من الخبراء (Mixture-of-Experts - [MoE](/tag/moe)) توفر وسيلة فعالة للتوسع، فإن الطرق الحالية المستخدمة مع [LoRA](/tag/lora) لا تزال تعاني من توازن أساسي: إذ تقوم إما بعزل الخبراء بشكل مفرط، مما يحد من [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بين المهام، أو تتيح [تحديثات](/tag/تحديثات) محددة للمهام أن تتجاوز المعلمات المهمة السابقة، مما يؤدي إلى [نسيان](/tag/نسيان) حاد.

للتغلب على هذه التحديات، يُقدم CP-MoE، وهو إطار [تعلم مستمر](/tag/[تعلم](/tag/تعلم)-مستمر) يتمحور حول خبير عابر يلتقط [التحديثات](/tag/التحديثات) المبكرة الخاصة بالمهام ويقوم بتوجيه دمجها في الخبراء المستقرين. يتميز CP-[MoE](/tag/moe) بآلية [توجيه](/tag/توجيه) تحافظ على الاتساق، حيث يستخدم الخبير العابر لتقدير تشابه التمثيلات مع الخبراء المستقرين ويوجه [التوجيه](/tag/التوجيه) [نحو](/tag/نحو) اختيار الخبراء الأكثر توافقًا. بالإضافة إلى ذلك، يُقدّم آلية تنظيمية موجهة تساعد على [حماية](/tag/حماية) المعلمات التاريخية المهمة أثناء [الدمج](/tag/الدمج).

تعمل هذه العناصر مجتمعة على تقليل تداخل المعلمات والنسيان، مع الحفاظ على [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بين المهام. لقد قمنا بالتحقق من فعالية CP-[MoE](/tag/moe) من خلال [اختبارات](/tag/اختبارات) [التعلم المستمر](/tag/[التعلم](/tag/التعلم)-المستمر) الأحادي والمتعدد [النماذج](/tag/النماذج) باستخدام [نماذج MoE](/tag/[نماذج](/tag/نماذج)-moe) المبنية على [LLM](/tag/llm) وVLM. على سبيل المثال، في اختبار SuperNI، حقق CP-[MoE](/tag/moe) أداءً رائدًا وأظهر قدرة قوية على [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بشكل مباشر لمهام غير مكتشفة. كما أظهر في [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) [VQA](/tag/vqa) v2 فعالية في [التوسع](/tag/التوسع) [نحو](/tag/نحو) [الاستدلال](/tag/الاستدلال) البصري المتعدد النماذج، مما قلل من النسيان بشكل متسق وتفوق على [معايير](/tag/معايير) [MoE](/tag/moe) القوية.

هذا التطور يعد خطوة فارقة [نحو](/tag/نحو) [تحسين أداء](/tag/[تحسين](/tag/تحسين)-[أداء](/tag/أداء)) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) وزيادة قدرتها على [التعلم](/tag/التعلم) من المهام المتعددة دون فقدان [المعلومات](/tag/المعلومات) المهمة. ما رأيكم في هذا التطور؟ هل تتوقعون تأثيره على [مستقبل الذكاء الاصطناعي](/tag/[مستقبل](/tag/مستقبل)-الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات).