في عالم الذكاء الاصطناعي، تُعتبر عملية "[نسيان](/tag/نسيان)" [البيانات](/tag/البيانات) ([Unlearning](/tag/unlearning)) في [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) ([LLMs](/tag/llms)) موضوعًا حيويًا. تهدف هذه [العملية](/tag/العملية) إلى إزالة [معلومات](/tag/معلومات) محددة، ولكن كيف يتم [تقييم](/tag/تقييم) فعاليتها؟ غالبًا ما يعتمد [التقييم](/tag/التقييم) على [مقاييس أداء](/tag/[مقاييس](/tag/مقاييس)-[أداء](/tag/أداء)) سطحية مثل [الدقة](/tag/الدقة) (Accuracy) والدقة النسبية ([Perplexity](/tag/perplexity))، وهو ما يظهر نتائج مُضللة.
لدينا [بحث](/tag/بحث) [جديد](/tag/جديد) يكشف أن [النماذج](/tag/النماذج) يمكن أن تبدو كأنها نسيت المعلومات، بينما يمكن بسهولة استعادة سلوكها الأصلي من خلال [تعديل](/tag/تعديل) قليل. هذه الظاهرة، المعروفة باسم “القدرة على التراجع” (Reversibility)، تشير إلى أن [المعلومات](/tag/المعلومات) ليست محذوفة تمامًا، بل مُكتومة.
لتسليط الضوء على هذه [الفجوة](/tag/الفجوة) الهامة في عملية التقييم، قدم الباحثون إطارًا جديدًا يُعرف بـ "[تحليل](/tag/تحليل) مستوى [التمثيل](/tag/التمثيل)" (Representation-Level Analysis Framework). يتضمن هذا الإطار [أدوات](/tag/أدوات) مثل [تحليل المكونات الرئيسية](/tag/[تحليل](/tag/تحليل)-المكونات-الرئيسية) (PCA)، ومحاذاة [النواة](/tag/النواة) المركزية (Center Kernel Alignment - CKA)، ومعلومات فيشر (Fisher Information)، ومدى تمثيل الانجراف (Mean PCA Distance) لقياس تأثير الحذف.
عبر تطبيق هذا الإطار على عدة طرق غير [تعلم](/tag/تعلم) البيانات، مجالات معلومات، ونماذج لغوية، تم [التعرف](/tag/التعرف) على أربع فئات متميزة من حالات النسيان استنادًا إلى قدرتها على التراجع ودرجة الكارثية. كما تم مقارنة [استراتيجيات](/tag/استراتيجيات) الاسترداد وتبين أن [كفاءة](/tag/كفاءة) إعادة [التعلم](/tag/التعلم) تعتمد على مصدر [البيانات](/tag/البيانات).
وفي النهاية، يكشف [البحث](/tag/البحث) عن [تحديات](/tag/تحديات) كبيرة في [نسيان البيانات](/tag/[نسيان](/tag/نسيان)-[البيانات](/tag/البيانات)) بطرق لا يمكن عكسها، مما يوفر [رؤى](/tag/رؤى) [قيمة](/tag/قيمة) لتطوير [خوارزميات](/tag/خوارزميات) للحذف أكثر [موثوقية](/tag/موثوقية).