في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (Large Language Models) من أبرز التطورات التي نعيشها. ومع استخدامها المتزايد، تظهر تحديات جديدة، وأحد أبرز هذه التحديات هو "النسيان الكارثي"، وهو ما يحدث عندما تفقد النماذج إمكانية تذكر المعلومات السابقة أثناء عملية التدريب.

دراسة جديدة تناولت هذا الموضوع بشكل عميق، حيث أوضحت أن التعلم العزيزي (Reinforcement Learning - RL) يتعامل بشكل أفضل مع هذه الظاهرة مقارنة بالتعليم المباشر (Supervised Fine-Tuning - SFT). يعود ذلك إلى أن التحديثات التي يجريها التعلم العزيزي تبقى أقرب إلى السياسة الأساسية للنموذج، مما يتيح له الاحتفاظ بقدراته السابقة بشكل أفضل.

ركز الباحثون على ما يسمى بـ "هشاشة الدوائر التفاضلية"، وهو مقياس يُستخدم لقياس مدى تأثير التعليم المباشر على الدوائر الحسابية الداخلية للنموذج. من خلال مقارنة بين أساليب التعلم العزيزي والتعليم المباشر على نموذج Qwen2.5-3B-Instruct، وجدوا أن التعليم المباشر يتكيف بسرعة أكبر مع المهام المستهدفة، ولكنه ينتج عن ذلك تشويش أكبر على الدوائر الداخلية وفقدان للقدرات السابقة.

بالمقابل، يتيح التعلم العزيزي الحفاظ على نسبة أكبر من الدوائر الأساسية، مما يجعله أكثر مقاومة للنسيان الكارثي، ولكن على حساب بطء التكيف مع المهام الجديدة. هذه النتائج تبرز كيف يمكن أن تؤدي استراتيجية الحفاظ على الدوائر إلى تحسين فعالية الذكاء الاصطناعي في المستقبل.

لذا، ما رأيكم في هذا التطور الملحوظ؟ هل تعتقدون أن التعلم العزيزي سيكون له تأثير كبير على مستقبل الذكاء الاصطناعي؟ شاركونا في التعليقات!