في عالم الذكاء الاصطناعي، تتصدر نماذج اللغات الضخمة (Large Language Models) المشهد، وتعتبر عملية تحسينها (fine-tuning) جزءاً أساسياً من تطورها ودقتها. ومع ذلك، برزت مشكلة "نسيان المهام السابقة" عند هذه النماذج أثناء عملية تحسينها للتكيف مع مهام جديدة. تعرض دراسة حديثة حلاً مبتكراً يتمثل في استخدام استراتيجيات التطور (Evolution Strategies) بدلاً من طرق التعلم المعزز (Reinforcement Learning).
تشير النتائج إلى أن النسيان السابق للمهام يمكن اعتباره مقدمة لأداء متغير، وليس نسياناً دائماً كما هو شائع. حيث يمكن للنموذج أن يستعيد أدائه الجيد في المهام السابقة أثناء تدريب استراتيجيات التطور. لكن ما الذي يسبب هذا الأداء المتغير؟!
توضح الدراسة أن هذه الظاهرة تعتمد على ديناميات تدريب استراتيجيات التطور، حيث يقوم النموذج بتحركات غير محكومة في مجالات الوزن الضعيفة، ما يؤدي إلى تحسين الأداء بشكل غير متوقع. ولتجاوز هذه المشكلة، تم تقديم تقنية جديدة تُعرف باسم "تلاشي الوزن المثبت" (Anchored Weight Decay).
تعمل هذه التقنية على تثبيت معلمات النموذج الأولية أثناء عملية التحسين، مما يضمن استقرار الأداء في المهام السابقة دون التأثير على الأداء في المهام الجديدة. وبفضل هذه الطرائق، يمكن تقديم أداء يكاد يضاهي الموديلات ذات أحجام كبيرة من السكان الخاصة باستراتيجيات التطور، ولكن بتكلفة حسابية أقل.
يظهر البحث أن نسيان المهام السابقة يمكن تجنبه بشكل كبير، مما يجعل من استراتيجيات التطور خياراً واعداً للتعلم المستمر في نماذج اللغات الضخمة.
تجاوز نسيان النموذج اللغوي الضخم: استراتيجيات التطور كحل مبتكر!
تقدم استراتيجيات التطور حلاً متميزاً لمشكلة نسيان المهام السابقة في نماذج اللغات الضخمة، حيث تعزز من أداء النموذج أثناء التكيف مع المهام الجديدة. اكتشف كيف يمكن لهذا النهج أن يغير قواعد اللعبة في التعلم المستمر!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
