في ظل تزايد التهديدات السيبرانية، أصبح من الضروري تقييم مدى كفاءة أنظمة الذكاء الاصطناعي (AI) في التصدي لهذه التهديدات. هنا يأتي دور AgentCyberRange، الذي يُعد الأول من نوعه في تقديم بنية تحتية مفتوحة ومتعددة النطاقات لقياس قدرات الهجمات السيبرانية الذاتية في بيئات واقعية.
تُظهر الأبحاث أن الأنظمة الذكية يمكنها إجراء مهام متقدمة مثل الكشف عن الثغرات واستغلالها. ومع ذلك، ما زالت التقديرات المتاحة محصورة بسبب عدم وجود نطاقات سيبرانية مفتوحة وقابلة لإعادة الإنتاج. كانت المعايير الحالية تُركز على مهارات معزولة مثل حل المسابقات الإلكترونية وإعادة إنتاج الثغرات، لكنها غالبًا ما تغفل السيناريوهات الهجومية الواقعية.
يقدم AgentCyberRange 110 ثغرات عبر 15 تطبيق ويب حقيقي و8 نطاقات تشبه البيئات العملية، بالإضافة إلى 156 مضيفة داخلية. ويقدم أداة Cage لإنجاز، وتنظيم، وجمع، والتحقق من النتائج. تنقسم المعايير إلى مرحلتين رئيسيتين: استغلال الويب، حيث تستكشف الوكلاء التطبيقات المعرضة وتتحقق من الثغرات، وما بعد الاستغلال، حيث تقوم الوكلاء بتحويل موطئ قدم أولي إلى اختراق أوسع داخليًا.
في تقييماتنا، قمنا بمقارنة ستة أنظمة ذكاء اصطناعي رائدة وفقًا لمؤشرات متطابقة. أظهر نموذج GPT-5.5 مع Codex أداءً متفوقًا، حيث استطاع حل 16.1% من مهام استغلال الويب و31.7% من مهام ما بعد الاستغلال. عند تقديم تلميحات أكثر تحديدًا، ارتفعت هذه النسب إلى 33.0% و46.3%.
لقد تم أيضًا اكتشاف ثغرات غير معروفة في مشاريع شعبية وتقنيات تهرب تجاوزت الدفاعات المضيفة. تشير هذه النتائج إلى أن التقييم في ظل بيئات سيبرانية مفتوحة ضروري لرصد القدرات الهجومية الناشئة بشكل واقعي.
AgentCyberRange: رصد قدرات الذكاء الاصطناعي في مواجهة التهديدات السيبرانية بدقة عالية
يقدم AgentCyberRange بنية تحتية جديدة لتقييم أنظمة الذكاء الاصطناعي في مهام الأمن السيبراني. هذا الابتكار يعزز من قدرتنا على رصد المخاطر ونقاط الضعف بشكل أكثر دقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
