في عالم الذكاء الاصطناعي، تظل مشكلة النسيان الكارثي (Catastrophic Forgetting) أحد أكبر التحديات التي تواجه [نماذج التعلم](/tag/[نماذج](/tag/نماذج)-[التعلم](/tag/التعلم)) المستمر، خصوصًا في [النماذج اللغوية الكبيرة](/tag/[النماذج](/tag/النماذج)-اللغوية-الكبيرة) ([LLMs](/tag/llms)) ونماذج [الرؤية](/tag/الرؤية)-[اللغة](/tag/اللغة) ([VLMs](/tag/vlms)). رغم أن الهياكل المبنية على خليط من الخبراء (Mixture-of-Experts - [MoE](/tag/moe)) توفر وسيلة فعالة للتوسع، فإن الطرق الحالية المستخدمة مع [LoRA](/tag/lora) لا تزال تعاني من توازن أساسي: إذ تقوم إما بعزل الخبراء بشكل مفرط، مما يحد من [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بين المهام، أو تتيح [تحديثات](/tag/تحديثات) محددة للمهام أن تتجاوز المعلمات المهمة السابقة، مما يؤدي إلى [نسيان](/tag/نسيان) حاد.
للتغلب على هذه التحديات، يُقدم CP-MoE، وهو إطار [تعلم مستمر](/tag/[تعلم](/tag/تعلم)-مستمر) يتمحور حول خبير عابر يلتقط [التحديثات](/tag/التحديثات) المبكرة الخاصة بالمهام ويقوم بتوجيه دمجها في الخبراء المستقرين. يتميز CP-[MoE](/tag/moe) بآلية [توجيه](/tag/توجيه) تحافظ على الاتساق، حيث يستخدم الخبير العابر لتقدير تشابه التمثيلات مع الخبراء المستقرين ويوجه [التوجيه](/tag/التوجيه) [نحو](/tag/نحو) اختيار الخبراء الأكثر توافقًا. بالإضافة إلى ذلك، يُقدّم آلية تنظيمية موجهة تساعد على [حماية](/tag/حماية) المعلمات التاريخية المهمة أثناء [الدمج](/tag/الدمج).
تعمل هذه العناصر مجتمعة على تقليل تداخل المعلمات والنسيان، مع الحفاظ على [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بين المهام. لقد قمنا بالتحقق من فعالية CP-[MoE](/tag/moe) من خلال [اختبارات](/tag/اختبارات) [التعلم المستمر](/tag/[التعلم](/tag/التعلم)-المستمر) الأحادي والمتعدد [النماذج](/tag/النماذج) باستخدام [نماذج MoE](/tag/[نماذج](/tag/نماذج)-moe) المبنية على [LLM](/tag/llm) وVLM. على سبيل المثال، في اختبار SuperNI، حقق CP-[MoE](/tag/moe) أداءً رائدًا وأظهر قدرة قوية على [نقل المعرفة](/tag/[نقل](/tag/نقل)-[المعرفة](/tag/المعرفة)) بشكل مباشر لمهام غير مكتشفة. كما أظهر في [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) [VQA](/tag/vqa) v2 فعالية في [التوسع](/tag/التوسع) [نحو](/tag/نحو) [الاستدلال](/tag/الاستدلال) البصري المتعدد النماذج، مما قلل من النسيان بشكل متسق وتفوق على [معايير](/tag/معايير) [MoE](/tag/moe) القوية.
هذا التطور يعد خطوة فارقة [نحو](/tag/نحو) [تحسين أداء](/tag/[تحسين](/tag/تحسين)-[أداء](/tag/أداء)) [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) وزيادة قدرتها على [التعلم](/tag/التعلم) من المهام المتعددة دون فقدان [المعلومات](/tag/المعلومات) المهمة. ما رأيكم في هذا التطور؟ هل تتوقعون تأثيره على [مستقبل الذكاء الاصطناعي](/tag/[مستقبل](/tag/مستقبل)-الذكاء-الاصطناعي)؟ شاركونا في [التعليقات](/tag/التعليقات).
CP-MoE: ثورة في التعلم المستمر للقضاء على نسيان البيانات الكارثي!
يستعرض بحث CP-MoE إطارًا مبتكرًا يعالج مشكلة النسيان في نماذج التعليم المستمر. بفضل آليات مبتكرة، يتم تحسين نقل المعرفة والحفاظ على الأجيال السابقة من البيانات، مما يفتح آفاق جديدة في الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
