في السنوات الأخيرة، أصبح استخدام البيانات الشخصية في تدريب نماذج الذكاء الاصطناعي يشكل تهديدًا متزايدًا لخصوصية المستخدمين. هنا يأتي دور مفهوم البيانات غير القابلة للتعلم (Unlearnable Examples)، والذي يسعى لتقليل هذا الخطر عن طريق إدخال اضطرابات غير ملحوظة في الأمثلة البريئة، مما يمنع تعلم الميزات.
رغم الدراسات السابقة التي تناولت هذا المفهوم، إلا أن أغلب الأبحاث تركزت على تقييم حيثياته في إعدادات التدريب من الصفر. ومع ذلك، فإن سلوك البيانات غير القابلة للتعلم في ظل البرمجة المدربة مسبقًا (Pretraining-Finetuning) لم يُستكشَف بالشكل الكافي حتى الآن.
في هذا السياق، نقدم أول دراسة منهجية لاستكشاف الظواهر غير القابلة للتعلم عبر مجموعة متنوعة من إعدادات التدريب. تكشف تحليلاتنا أن تحميل وتجميد الأوزان المدربة مسبقًا يضعف بشكل ملحوظ فعالية أساليب البيانات غير القابلة للتعلم المتاحة. ونشرح ذلك من خلال مفهوم التصفية الدلالية (Semantic Filtering)، حيث تميل البيانات غير القابلة للتعلم إلى دفع النماذج لتحليل الضوضاء غير الدلالية، مما يضعف من قدراتها على استخراج المعلومات الدلالية. ومع وجود البرمجة المدربة مسبقًا، فإن الطبقات السطحية المجمدة تحافظ على دلالات البيانات وتفلتر المعلومات المشتتة مثل الضوضاء غير القابلة للتعلم.
بناءً على هذه الاكتشافات، نقترح استراتيجية خداع هرمية تُعرف باسم التمويه الدلالي السطحي (Shallow Semantic Camouflage) تُقيّد عملية التوليد ضمن فضاء دلالي صالح، مما يسعى لتجاوز الكبح الدلالي الناتج عن الأوزان المدربة مسبقًا. وتُظهر التجارب الواسعة أن طريقتنا تحافظ باستمرار على عدم قابلية تعلم البيانات حتى في ظل إعدادات تدريب صعبة، مثل تجميد الطبقات السطحية والبرمجة المدربة مسبقًا المركزّة على الدلالات (SF-Pretrain).
بفضل هذه الطريقة الجديدة، نستطيع سد الفجوة الحرجة في تعلم غير القابل للتعلم بناءً على المدرب مسبقًا.
هل تعتقد أن الذكاء الاصطناعي قادر على "نسيان" المعلومات؟ شاركونا آرائكم في التعليقات!
هل يمكن للذكاء الاصطناعي نسيان المعلومات؟ استكشاف الظواهر المعقدة للبيانات غير القابلة للتعلم!
تقدم دراسة جديدة تحليلًا عميقًا للبيانات غير القابلة للتعلم (Unlearnable Examples) وكيفية تعاملها مع أنظمة التدريب المختلفة، خاصةً في ظل وجود القيود الناتجة عن النماذج المدربة مسبقًا. تعرّف على طريقة جديدة لمواجهة التحديات التي تفرضها هذه الظواهر.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
