في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (Large Language Models) أحد الابتكارات الرائدة، حيث تُستخدم في العديد من التطبيقات المتقدمة. لكن، كيف يتم تحديث المعرفة الداخلية لهذه النماذج؟ تقدم أساليب تحرير المعرفة القائم على المعلمات (Parameter-based Knowledge Editing) آلية لتعديل المعرفة من خلال تغييرات موضعية في الأوزان. ومع ذلك، اتضح أن هذه الطرق تتجاهل العديد من القيود النظرية الأساسية.
تتناول دراسة جديدة الصادرة عن arXiv التحديات المتعلقة بأساليب تحرير المعرفة. تعتمد الورقة على فرضية الانهيار البُعدي (Dimensional Collapse Hypothesis) لتوضيح كيف يمكن لتعديلات المعلمات الموضعية أن تتسبب في تأثيرات سلبية عالمية تؤدي إلى انهيار في قدرة النموذج على التفكير.
أجرت الدراسة تقييماً شمولياً للأداء، حيث تمت دراسة تأثير تعقيد المعرفة وعدد التعديلات وأبعاد التقييم. وأظهرت النتائج أن طرق تحرير المعرفة القائمة على المعلمات غالباً ما تؤدي إلى تآكل قدرات النموذج الأساسية.
في المقابل، برزت طرق استرجاع المعرفة كخيار أكثر فعالية، مما يعني أن الحفاظ على قدرة النماذج الأساسية يجب أن يكون نقطة محورية في الأبحاث المستقبلية. إن هذه النتائج تدعو للتفكير مجدداً في الأساليب الحالية وتطرح تساؤلات حول كيفية تحسين أداء النماذج بطرق أكثر تقدماً.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
إعادة التفكير في تحرير المعرفة القائم على المعلمات في نماذج اللغات الضخمة: تحديات نظرية وأدلة تطبيقية
تسلط دراسة جديدة الضوء على التحديات النظرية لأساليب تحرير المعرفة في نماذج اللغات الضخمة. تشير النتائج إلى أن هذه الأساليب قد تؤدي إلى تآكل قدرات النماذج الأساسية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
