في ظل [التوسع](/tag/التوسع) السريع في استخدام [الشبكات](/tag/الشبكات) السحابية، أصبحت التحديات الأمنية تفرض عبئًا متزايدًا على المؤسسات. بينما تمنح [تقنيات](/tag/تقنيات) الافتراضية والتجميع [الشبكات السحابية](/tag/[الشبكات](/tag/الشبكات)-السحابية) قدرة على [التكيف](/tag/التكيف) والمرونة، فإنها تفتح أيضًا المجال لزيادة الهجمات. وللتغلب على هذه التحديات، تم [تطوير](/tag/تطوير) [استراتيجيات](/tag/استراتيجيات) دفاعية تعتمد على [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) ([Reinforcement Learning](/tag/reinforcement-learning)) لتحسين جهود [نشر](/tag/نشر) الموارد وسياسات العزل، مما يسهم في تعزيز [مرونة](/tag/مرونة) الأنظمة.

ومع ذلك، فإن الأساليب الموجودة حاليًا تعاني من عدم القدرة على [التكيف](/tag/التكيف) بسرعة مع التغيرات الديناميكية في هيكل الشبكة، مما يتطلب إعادة [تدريب مستمر](/tag/[تدريب](/tag/تدريب)-مستمر). لذلك، نحن نقدم إطار CyberOps-Bots، وهو [نموذج](/tag/نموذج) للتعلم المعزز معتمد على [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)). مستلهمًا من [نموذج](/tag/نموذج) تكتك-[تقنيات](/tag/تقنيات) MITRE ATT&CK، يتميز CyberOps-Bots بتصميم هرمي.

تتضمن هذه البنية طبقتين: الأولى تشمل [وكيل](/tag/وكيل) [LLM](/tag/llm) يتمتع بأربع وحدات - [التخطيط](/tag/التخطيط) (ReAct)، الإدراك القائم على IPDRR، [الذاكرة](/tag/الذاكرة) قصيرة وطويلة الأجل، وتكامل الإجراءات/[الأدوات](/tag/الأدوات). وتقوم هذه الوحدة بأداء مهام [الوعي](/tag/الوعي) العالمي، والتعرف على [نوايا](/tag/نوايا) البشر، وتخطيط [الاستراتيجيات](/tag/الاستراتيجيات). بينما تتولى [وكالات](/tag/وكالات) [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) في الطبقة الثانية، التي تم تطويرها من خلال [تدريب مسبق](/tag/[تدريب](/tag/تدريب)-مسبق) غير متجانس، [تنفيذ](/tag/تنفيذ) [إجراءات](/tag/إجراءات) الدفاع ضمن مناطق الشبكة المحلية.

تظهر [التجارب](/tag/التجارب) على [بيانات حقيقية](/tag/[بيانات](/tag/بيانات)-حقيقية) من [الشبكات السحابية](/tag/[الشبكات](/tag/الشبكات)-السحابية) أن CyberOps-Bots يحافظ على توافر الشبكة بنسبة 68.5% أعلى مقارنةً بأفضل [الخوارزميات](/tag/الخوارزميات) الموجودة، ويحقق ثمار [أداء](/tag/أداء) مبكر بنسبة 34.7% عند تغيير السيناريوهات بدون الحاجة لإعادة [تدريب](/tag/تدريب). وهذه [الدراسة](/tag/الدراسة) تمثل الأولى من نوعها في إنشاء إطار متين للتعلم المعزز مع [دعم](/tag/دعم) Human-in-the-Loop من أجل الدفاع عن [الشبكات السحابية](/tag/[الشبكات](/tag/الشبكات)-السحابية).

ما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات).