في ظل تزايد التهديدات التي تواجه أنظمة الذكاء الاصطناعي، تقدم الأبحاث الحديثة رؤى جديدة حول كيفية التعافي من الهجمات على الأبواب الخلفية (Backdoor Attacks) التي يمكن أن تؤدي إلى عواقب وخيمة. تكشف الدراسات الحالية أن الدفاعات المطبقة على الأبواب الخلفية لا تظهر القوة الكافية لمواجهة أنواع معينة من الهجمات، مما يستدعي تطوير استراتيجيات أكثر فعالية.
تسعى هذه البحث الجديدة إلى إعادة تصور التعلم المضاد للأبواب الخلفية من خلال دمج مفهوم النسيان الكارثي (Catastrophic Forgetting) في إطار التعلم المستمر (Continual Learning). يقترح الباحثون نموذجا يتكون من ثلاث مراحل متتالية تهدف إلى ضمان محو فعّال للأبواب الخلفية. بعد ذلك، تم تعريف الشروط اللازمة لتحقيق هذا المحو بشكل كامل.
من خلال هذه الفكرة الجديدة، تم تقديم تقنية Blind Inversion-Backdoor Adversarial Unlearning (BI-BAU)، التي تضع أسسًا لتوليد أمثلة مضادة تلبي شروط المحو عن طريق تحويل المشكلة إلى مسألة عكس أعمى.
يتم حل هذه المسألة من خلال دمج عملية تحسين ثنائية المستوى للتدريب العدواني ضمن إطار العمل الخاص بخوارزمية التوقع-التعظيم (Expectation-Maximization EM)، ما يساعد في تحسين الأهداف التي تهدف إلى تحقيق النتائج الأكثر دقة.
بالإضافة إلى ذلك، تم توسيع نطاق BI-BAU لتشمل سيناريوهات عدوانية غير مستهدفة مع فئات أهداف غير معروفة، فضلاً عن مهام التعلم التبايني المتعدد الأبعاد، مما يعزز إمكانية تطبيقها في البيئات الواقعية حيث قد تتعرض النماذج المدربة مسبقًا للخطر.
تشير التجارب الواسعة إلى أن الطريقة الجديدة تتمتع بإمكانية تطبيق واسعة عبر طيف كبير من هجمات الأبواب الخلفية، وقد أثبتت فعاليتها في القضاء الكامل على تأثيرات الأبواب الخلفية من النماذج المتأثرة. وبذلك، تفتح هذه الدراسة أفقًا جديدًا في بناء أنظمة ذكاء اصطناعي أكثر أمانًا وثقة.
إعادة التفكير في التعلم المضاد للأبواب الخلفية: كيف تؤثر النسيان الكارثي على الأمان الذكي؟
تشير دراسة جديدة إلى أن الدفاعات الحالية ضد الأبواب الخلفية تعاني من نقص في القوة، وتقدم مقاربة مبتكرة للتعلم والمحو الموجه. من خلال دمج استراتيجيات التعلم المستمر، تم تطوير تقنية جديدة لتحقيق أمن أفضل في الأنظمة الذكية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
