تسعى تقنيات حذف البيانات (Machine Unlearning) إلى إزالة تأثير نقاط بيانات معينة من نموذج تم تدريبه مسبقًا دون الحاجة إلى إعادة تدريبه بشكل مكلف. ومع ذلك، تظهر الأبحاث أن معظم الخوارزميات المستخدمة في هذا المجال تعتمد على تقنيات تقريبية وتقييم أدائها يعتمد بشكل كبير على التجارب العملية. في العادة، يتم تنفيذ خوارزميات حذف البيانات عدة مرات بشكل مستقل، حيث تبدأ جميعها من نفس النموذج المدرب باستخدام بذور تدريب واحدة فقط.
تظهر التجارب، خاصة في تصنيف الصور، أن هذه الممارسة قد تؤدي إلى نتائج غير تمثيلية، نظرًا لأن أداء حذف البيانات يمكن أن يتأثر بشكل لافت باختيار بذور التدريب. هذا الأمر يصبح أكثر وضوحًا مع الأساليب الحاسوبية الحتمية (Deterministic Unlearning Methods) التي تعطي نفس النتائج عند البدء من نفس النموذج المدرب.
ولقد أكدت تجارب إضافية على أساليب التعلم الفيدرالي (Federated Learning-to-Rank) والنماذج اللغوية الضخمة (Large Language Models) أن هذه المشكلة تتجاوز فقط تصنيف الصور. ومن المعروف أن زيادة عدد بذور الحذف لا يمكن أن تعوض بشكل عام عن قلة استخدام بذور تعليمية متعددة.
لذا، تقدم الدراسة إرشادات حول كيفية اختيار العدد المناسب من بذور التدريب وبذور الحذف لتحقيق أفضل نتائج ممكنة. إذن، ما هي أفضل الاستراتيجيات التي يمكن اعتمادها لتعزيز أداء خوارزميات حذف البيانات؟ شاركونا آراءكم في التعليقات.
أهمية تعدد البذور التعليمية في تقييم تقنيات حذف البيانات من الأنظمة الذكية
تسلط دراسة جديدة الضوء على تأثير تعدد البذور التعليمية على تقنيات حذف البيانات من النماذج المدربة. النتائج تشير إلى ضرورة اعتماد استراتيجيات متعددة لتحسين دقة التقييم.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
