في عالم تتزايد فيه التهديدات السيبرانية، نجد أن الحاجة لتقنيات متطورة أصبحت أكثر إلحاحًا من أي وقت مضى. لذا، يسرنا أن نقدم لكم ExCyTIn-Bench، المعيار الأول الذي يهدف إلى تقييم وكيل نماذج اللغات الضخمة (LLM) في مهمة التحقيق حول التهديدات السيبرانية.

إن المحللين الأمنيين الحقيقيين يقضون وقتًا طويلاً في فرز كميات ضخمة من سجلات الأمان المتنوعة، ومتابعة سلسلة معقدة من الأدلة لتحديد التهديدات. ومع تقدم تكنولوجيا نماذج اللغات الضخمة، أصبح بناء وكلاء قائمين على هذه النماذج لتحقيق التهديدات بشكل آلي اتجاهًا واعدًا لتبسيط هذه العمليات.

تتضمن المنصة الجديدة معيارًا مبنيًا على بيئة Azure مُسيطر عليها، تحتوي على قواعد بيانات SQL تضم 57 جدول تحديث من Microsoft Sentinel وخدمات ذات صلة، بالإضافة إلى 7542 سؤال من إنشاء نماذج اللغات الضخمة. من خلال استخدام سجلات الأمان المستخرجة باستخدام منطق اكتشاف مُعد من قبل خبراء، تم بناء مخططات التحقيق حول التهديدات، وتوليد الأسئلة بناءً على نقاط معينة على هذه المخططات، مما يمنح كل سؤال حقيقية تفسر الإجابات.

تكشف التجارب الشاملة التي أُجريت على مجموعة الاختبار باستخدام نماذج مختلفة عن صعوبة المهمة؛ حيث استطاع أفضل نموذج حتى الآن تحقيق تقييم 0.606، مما يدل على وجود مجال واسع للبحث في المستقبل.

كن جزءًا من هذه الثورة في الأمن السيبراني، حيث أن الشيفرة المصدرية متاحة على GitHub، مما يتيح للباحثين والمطورين استثمار هذه التكنولوجيا المتطورة.