في عالم يعتمد بشكل متزايد على تقنيات الذكاء الاصطناعي، تعد نماذج اللغات الضخمة (Large Language Models) واحدة من أبرز الابتكارات التي أثرت على العديد من المجالات. ومع تزايد استخدامها، ظهرت حاجة ماسة لإجراءات فعالة لإزالة المعرفة غير المرغوب فيها من هذه النماذج. في هذا السياق، تناولت دراسة حديثة مقارنة بين أساليب العينات التقليدية والنمطية في هذا المجال.

تشير الدراسة إلى أن الإعداد التقليدي لإعادة التعلم في نماذج اللغات الضخمة يتضمن مجموعتين أساسيتين: مجموعة "النسيان" (forget) ومجموعة "الاحتفاظ" (retain). الهدف الأول هو إزالة المعرفة غير المرغوب فيها من مجموعة النسيان، بينما يتطلب الهدف الثاني الحفاظ على المعرفة المتبقية من مجموعة الاحتفاظ. ومع ذلك، تظهر بعض التعقيدات المخفية في هذه العمليات، حيث يتم تقسيم مجموعة الاحتفاظ إلى مجموعات جيران تحتوي على معلومات متصل بها، مما يدعو للشك في فاعلية الطريقة المستخدمة.

النقطة الرئيسية هي أن معظم الدراسات السابقة تعتمد على مجموعة واحدة فقط من الجيران، مع معرفة عامة، مما لا يعكس التعقيدات الواقعية للعلاقات في البيانات. كما تشير النتائج الجديدة إلى أن طرق العينة التقليدية، مثل العينات 1:1 أو العينة التكرارية، قد لا تكون فعالة كما يعتقد.

لتجنب هذه الإشكاليات، تقدم الدراسة مجموعة من الممارسات المثلى، مثل استخدام مجموعات متنوعة من الجيران لتحقيق توازن بين فعالية النسيان وفعالية النموذج. بالإضافة إلى ذلك، تشير النتائج إلى أن نقل أسلوب التكرار إلى استراتيجية عينة من الكيانات النمطية (Modular Entity-Level Unlearning) يمكن أن يكون خيارًا أكثر فعالية. يوفر هذا الأسلوب المرونة، مما يؤدي إلى تحسين نتائج إعادة التعلم.

باستخدام خوارزميات قوية، يمكن لهذا النهج النمطي أن يقدم مسارًا واضحًا وثابتًا نحو فعالية إعادة التعلم. في ختام الدراسة، تشجع النتائج على إعادة التفكير في المرونة والأداء في تقنيات نماذج اللغات الضخمة، مما يدعونا لمراجعة أساليبنا فيما يتعلق بإزالة المعرفة غير المرغوب فيها.