في ظل التطورات المتسارعة في مجال الأمن السيبراني، تعتبر الهجمات العدائية على مصنفات الأمن السيبراني تحديًا مزدوجًا يتجاوز مجرد تقليل دقة التنبؤات، ليصل إلى زعزعة استقرار التفسيرات المستندة إلى نموذج SHAP التي يعتمد عليها المحللون لفهم التنبيهات وتقييمها.

توسعت دراستنا السابقة التي تم عرضها في مؤتمر MLP لتشمل نماذج Random Forest وXGBoost عبر أربعة مجموعات بيانات أمنية (كعناوين المواقع الاحتيالية و UNSW-NB15 و NF-ToN-IoT و HIKARI-2021). ويمثل هذا البحث نقلة نوعية حيث نقيم خمس هجمات، بما في ذلك ثلاث طرق للغزو تصنف ضمن فئة النماذج السوداء (black-box) التي تكون غير قابلة للاشتقاق، وتهدف مباشرة إلى نماذج الأشجار.

أحد الابتكارات التي نقدمها هو مؤشر استقرار التفسير (ESI)، وهو مقياس عددي يُحسب من تذبذب الإسناد في TreeSHAP تحت تأثير التدخل العدائي، ويقابل المقياس التقليدي لمؤشر المتانة (RI) على نفس المقياس من [0،1].

بينت نتائجنا أن الهجمات العدائية المعتمدة على التدرج (gradient-based black-box attacks) مثل ZOO تؤدي إلى نتائج هشة ضد نموذج XGBoost حيث كانت المتانة الواضحة ~0.98، لكن الهجمات المرتكزة على النقاط مثل Square Attack تكشف عن نقاط ضعف حقيقية (RI ~0.36).

تميّز تلك التدخلات الهشة بتأثير ملحوظ على منحنيات الإسناد، مما يشير إلى أنه حتى الذكاء الاصطناعي قد ينطوي على مفاجآت؛ ففي حين أن XGBoost سجل ESI يتراوح بين ~0.06-0.16، فإن Random Forest سجلت 0.14-0.29.

رسالتنا هنا هي أن المتانة في التنبؤ والاستقرار في التفسير هما محوران منفصلان يجب قياسوها معًا لتحسين أدوات الأمان السيبراني. نموذج جديد يحمل بين طياته هيكلًا ثنائي المحاور (اعتمادًا على التدرج، وكفاءة الاستعلام) يفسر ترتيب الهجمات الملاحظة ويوفر إرشادات عملية لتقييم مجموعات الأشجار.

باختصار، هذا البحث يمثل خطوة كبيرة نحو تحسين فهمنا لهجمات الذكاء الاصطناعي وتطبيقاتها عملية لتحسين أدوات الأمن السيبراني. فما رأيكم في هذا التطور؟ شاركونا في التعليقات.