في ظل التوسع السريع في استخدام الشبكات السحابية، أصبحت التحديات الأمنية تفرض عبئًا متزايدًا على المؤسسات. بينما تمنح تقنيات الافتراضية والتجميع الشبكات السحابية قدرة على التكيف والمرونة، فإنها تفتح أيضًا المجال لزيادة الهجمات. وللتغلب على هذه التحديات، تم تطوير استراتيجيات دفاعية تعتمد على التعلم المعزز (Reinforcement Learning) لتحسين جهود نشر الموارد وسياسات العزل، مما يسهم في تعزيز مرونة الأنظمة.

ومع ذلك، فإن الأساليب الموجودة حاليًا تعاني من عدم القدرة على التكيف بسرعة مع التغيرات الديناميكية في هيكل الشبكة، مما يتطلب إعادة تدريب مستمر. لذلك، نحن نقدم إطار CyberOps-Bots، وهو نموذج للتعلم المعزز معتمد على نماذج اللغة الكبيرة (Large Language Models). مستلهمًا من نموذج تكتك-تقنيات MITRE ATT&CK، يتميز CyberOps-Bots بتصميم هرمي.

تتضمن هذه البنية طبقتين: الأولى تشمل وكيل LLM يتمتع بأربع وحدات - التخطيط (ReAct)، الإدراك القائم على IPDRR، الذاكرة قصيرة وطويلة الأجل، وتكامل الإجراءات/الأدوات. وتقوم هذه الوحدة بأداء مهام الوعي العالمي، والتعرف على نوايا البشر، وتخطيط الاستراتيجيات. بينما تتولى وكالات التعلم المعزز في الطبقة الثانية، التي تم تطويرها من خلال تدريب مسبق غير متجانس، تنفيذ إجراءات الدفاع ضمن مناطق الشبكة المحلية.

تظهر التجارب على بيانات حقيقية من الشبكات السحابية أن CyberOps-Bots يحافظ على توافر الشبكة بنسبة 68.5% أعلى مقارنةً بأفضل الخوارزميات الموجودة، ويحقق ثمار أداء مبكر بنسبة 34.7% عند تغيير السيناريوهات بدون الحاجة لإعادة تدريب. وهذه الدراسة تمثل الأولى من نوعها في إنشاء إطار متين للتعلم المعزز مع دعم Human-in-the-Loop من أجل الدفاع عن الشبكات السحابية.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.