في عالم الذكاء الاصطناعي، يمثل النسيان الكارثي (Catastrophic Forgetting) أحد أكبر التحديات التي تواجه [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)). حيث تتعرض هذه [النماذج](/tag/النماذج) لفقدان قدراتها الأساسية عند إجراء تعديلات عليها. لكن، ماذا لو كان بإمكاننا استعادة هذه القدرات بفعالية بعد [التعديل](/tag/التعديل)؟
في [دراسة](/tag/دراسة) حديثة، طور الباحثون منهجية جديدة تُعرف باسم DG-Hard، والتي تعالج مشاكل النسيان الكارثي من خلال استعادة القدرات المعطلة بدون الحاجة لإعادة [تدريب النموذج](/tag/[تدريب](/tag/تدريب)-النموذج) بالكامل. يستند هذا المنهج إلى نظام إعادة التصحيح المركب الذي يستخدم فقط نقاط الإسناد المدربة سلفاً والنموذجات المعدلة.
تُعتبر DG-Hard طريقة إصلاح طيفية تهدف إلى الحفاظ على التحسينات المكتسبة من التعديل، في حين تستعيد القدرات المتضررة. يتعامل هذا الأسلوب مع [التعديل](/tag/التعديل) كإشارة منخفضة الترتيب مدمجة في الضوضاء، مما يجعل من الممكن تقليل الخسائر الناتجة عن [التعديل](/tag/التعديل) دون الحاجة إلى ضبط متطلبات جديدة.
تشير النتائج التي تم التوصل إليها من 14 إعداداً للنموذج ومهمة [عبر](/tag/عبر) 9 مجال مُحتفظ به مسبقاً، إلى أن DG-Hard يحقق أقوى إصلاح متوازن مقارنة بأساليب ما بعد التصحيح الأخرى. ولعل الأهم من ذلك أن هذه الطريقة تعيد [تنسيق](/tag/تنسيق) [الأمان](/tag/الأمان) المتدهور الناتج عن التعديلات الودية بدون استخدام [بيانات](/tag/بيانات) [التنسيق](/tag/التنسيق).
إن [نجاح](/tag/نجاح) DG-Hard في استعادة [الأداء العالي](/tag/[الأداء](/tag/الأداء)-العالي) للنماذج يفتح آفاقاً جديدة لفهم كيف يمكن [تحسين](/tag/تحسين) قدرات [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) من دون الحاجة إلى عمليات [تدريب](/tag/تدريب) مكثفة جديدة. يبدو أن بعض فقدان القدرات بسبب [التعديل](/tag/التعديل) ليس نتيجة [حتمية](/tag/حتمية) للتخصص، بل هو بقايا طيفية يمكن إزالتها بشكل فعال. هل نتوقع [رؤية](/tag/رؤية) مثل هذه التطورات في المزيد من المجالات؟
استعادة القدرات المعطلة: حل جديد لمشكلة النسيان الكارثي في نماذج الذكاء الاصطناعي
تمكن الباحثون من تطوير طريقة مبتكرة لاستعادة القدرات المفقودة في نماذج اللغة بعد عمليات التعديل، تسمى DG-Hard، والتي تعد بتجاوز مشكلة النسيان الكارثي. النتائج تشير إلى إمكانية استعادة الأداء العالي دون الحاجة لتدريب جديد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
