في عصر التكنولوجيا المتقدمة، برزت قضية قدرة أنظمة الذكاء الاصطناعي على تنفيذ الهجمات الإلكترونية بشكل مستقل كأحد الخطوط الحمراء التي يجب ألا تتخطاها هذه الأنظمة. في إطار هذا النقاش، تمثل القدرة على الاختراق الذاتي (Autonomous Penetration) عنصراً جوهرياً يُتيح لأنظمة الذكاء الاصطناعي المدعومة بنماذج اللغات الضخمة (LLMs) القيام بعمليات هجوم ضد خوادم معينة دون الحاجة لتدخل بشري، بما في ذلك اكتشاف الثغرات واستغلالها للحصول على وصول غير مصرح به.

لقد تم إجراء العديد من الدراسات لفهم قدرات الاختراق المستقلة لأنظمة الذكاء الاصطناعي، لكن معظم التقييمات الحالية تعتمد على مناهج غير شفافة أو سيناريوهات اختبار اختراق غير واقعية، مما يجعلها تعجز عن تقديم تقييم دقيق لقدرة الأنظمة على تنفيذ هذه العمليات بشكل مستقل في سياقات هجمات ضخمة.

لمعالجة هذه القيود، تم تطوير إطار تقييم جديد يشتمل على عنصرين رئيسيين: خوادم الهدف (Target Servers) وهيكل الوكيل (Agent Scaffolding). يتضمن الجانب الخاص بخوادم الهدف البيئة المستهدفة في مستويين مختلفين بناءً على عدد الخدمات الآمنة المتاحة دون ثغرات معروفة: المستوى الأول (Tier 1) الذي يضم خدمة آمنة واحدة، والمستوى الثاني (Tier 2) الذي يشتمل على ثلاث خدمات آمنة. وقد تم إنشاء إجمالي 300 خادم هدف للاختبار.

أما هيكل الوكيل، فيعتمد على بنية وكيل متعددة الاستخدامات مزودة بعدد من أدوات الأمن السيبراني العامة، دون أي معرفة مسبقة مستهدفة. وقد تم تقييم 19 نموذجاً من نماذج اللغات الضخمة، أظهرت نتائج الاختراق معدلات نجاح تتراوح من 10.7% إلى 69.3%.

تيسير هذه التكنولوجيا المتطورة يزيد بشكل مستمر مع التحسينات في أداء النماذج. وهذا يثير تساؤلات حول الأمن السيبراني ومستقبل استخدام الذكاء الاصطناعي في هذا المجال.

مما لا شك فيه أن تطوير مثل هذه التقنيات يحمل معه مسئوليات أخلاقية ويستدعي التفكير في كيفية تنظيم استخدامها. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.