في خضم التحديات المتزايدة في عالم الأمن السيبراني، قدم الباحثون تقنية جديدة تحمل اسم "ديبستيج (DeepStage)"، وهي إطار عمل يعتمد على التعلم المعزز العميق (Deep Reinforcement Learning - DRL) مُصمم لمواجهة التهديدات المستمرة المعقدة (Advanced Persistent Threats - APTs) بطرق متقدمة ومبتكرة.

تمثل بيئة العمل المؤسسية في هذا الإطار عملية قرار ماركوف جزئية الملاحظة (Partially Observable Markov Decision Process - POMDP)، حيث يتم دمج بيانات أصالة المضيف ورصد الشبكة في رسوم بيانية موحدة. يبني "ديبستيج" على العمل السابق المعروف باسم "ستيج فايندر (StageFinder)", حيث يستفيد من شبكة عصبية رسومية (Graph Neural Network) ومُقدّر مراحل قائم على LSTM لاستنتاج المراحل الاحتمالية للمهاجمين بما يتماشى مع إطار عمل MITRE ATT&CK.

تُستخدم الاعتقادات المرتبطة بالمراحل، مع تضمينات الرسوم البيانية، لتوجيه وكيل تحسين السياسات القريب (Proximal Policy Optimization - PPO) في اختيار إجراءات دفاعية عبر المراقبة، التحكم في الوصول، الاحتواء، والتعافي.

أظهرت التجارب في بيئة اختبار واقعية مدعومة بنماذج APT من CALDERA أن "ديبستيج" حقق متوسط درجة F1 بلغت 0.887 ونسبة نجاح في التخفيف بلغت 84.7%. هذا الأداء يتجاوز معيار DRL المدروس بمعدل 21.8% في درجة F1 و16.2% في نسبة النجاح في التخفيف.

تُظهر النتائج فعالية "ديبستيج" في توفير دفاع سيبراني ذاتي وفعّال بتكاليف منخفضة، مما يبشر بمستقبل أكثر أماناً في مجال الأمن السيبراني. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.