في عالم الذكاء الاصطناعي، يعتبر نسيان البيانات (Data Unlearning) أداة حيوية لإزالة تأثير عينات تدريب معينة من النماذج المدربة. تظهر الأبحاث أن الأساليب الحالية تعتمد بشكل أساسي على تعظيم الخسارة على عينة النسيان، مما قد يؤدي في كثير من الأحيان إلى تدهور الجودة أو النسيان الناقص. بينما معظم الطرق تُطبق النسيان بشكل موحد عبر مراحل الانتشار (Diffusion)، فإنها لا تأخذ بعين الاعتبار ديناميات الانتشار من الضجيج إلى البيانات.
تُظهر دراستنا المنهجية حول مراحل الانتشار أن النسيان في نماذج الانتشار ليس متساويًا عبر الزمن والتردد، مع وجود تبرير نظري عن تشويه التوزيع وتحدي نفع النسيان. من خلال نسيان الزمن والتردد بشكل انتقائي في نماذج الانتشار، تمكنا من تحقيق معدلات نجاح أعلى في النسيان وتحسين جودة الجيل عبر إعدادات متنوعة. إضافةً إلى ذلك، قدمنا مقياس SSCD المحسن الذي يقيس الاختلاف باستخدام مسافة الاضطراب الموحدة.
تقدم هذه الأبحاث رؤى عملية لفهم وتحسين عملية نسيان البيانات في نماذج الانتشار، مما يفتح آفاقًا جديدة أمام الابتكارات المستمرة في الذكاء الاصطناعي.
كيف يمكن للتعلم غير الموجه أن يحسن جودة نماذج الذكاء الاصطناعي؟
تقدم دراسة جديدة آليات مبتكرة لتحسين عملية نسيان البيانات في نماذج التعلم، مما يساهم في تعزيز جودة النتائج. من خلال تقديم استراتيجيات جديدة، تحققت معدلات نجاح أعلى في نسيان البيانات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
