في عالم تعلم الآلة، يمثل التعلم الفيدرالي (Federated Learning) طفرات عديدة في كيفية تدريب النماذج بشكل متزامن دون الحاجة إلى تجميع البيانات في مكان واحد. ومع ذلك، فإن هذا النظام ليس خاليًا من التحديات، حيث تمثل المفاتيح الخلفية (Backdoors) واحدة من أكبر المخاطر. في هذا السياق، تقدم دراسة FLAT نهجًا متقدمًا لتحديد هذه المفاتيح الخلفية المخفية والتي كانت قد تظل خارج دائرة الضوء.
تستند FLAT إلى مفهوم فريد من نوعه يتمثل في اختبار موثوقية شامل. بدلاً من الاعتماد على اختبارات تقليدية تتمثل في دقة نظيفة (Clean Accuracy) أو معدل نجاح الهجوم (Attack Success Rate)، يوفر FLAT طريقة لتقييم النماذج من خلال فصل "نية الهدف" (Target Intent) عن "تحقيق الزناد" (Trigger Realization). هذا الفصل يتيح تحليلًا أعمق لسلوك النموذج، حيث يتمكن من الكشف عن كيفية تغير سلوك النماذج عبر أهداف متعددة.
خلال التجارب التي أجريت على مجموعات بيانات مشهورة مثل CIFAR-10 وCIFAR-100 وTiny-ImageNet، أثبت FLAT قدرته على الحفاظ على أداء نظيف مع معدلات نجاح هجوم تصل إلى 99.49%، 99.66%، و94.10% على التوالي. بالإضافة إلى ذلك، تكشف النتائج عن استجابات دفاع غير متناسقة، حيث يمكن لقواعد الخادم تقليل فعالية أحد الأهداف بينما تظل أخرى نشطة.
هذه النتيجة تعزز الحاجة إلى تقييمات دقيقة لمفاتيح خلفية في التعلم الفيدرالي، والتي ينبغي أن تتضمن تقييمات متوازنة لمعدل نجاح الهجوم عن كل هدف، وأسوأ وأفضل؛ بالإضافة إلى تعقب الاستجابات الدفاعية. يمثل اكتشاف FLAT خطوة مهمة نحو تعزيز أمان نماذج التعلم الفيدرالي، وهو يشكل نقطة انطلاق لتطوير اختبارات أكثر دقة وموثوقية في هذا المجال.
اكتشاف فشل مفاتيح خلفية مخفية في التعلم الفيدرالي: FLAT يكشف المستور!
تقدم الدراسة الحديثة FLAT نهجًا جديدًا لفحص مفاتيح خلفية مخفية في التعلم الفيدرالي، مما يتيح فهمًا أعمق لفشل النماذج. طُبقت هذه التقنية بنجاح على مجموعات بيانات معترف بها، مسلطة الضوء على استجابات الدفاع غير المتساوية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
