في عصر يتزايد فيه التهديد السيبراني، أصبح توفير معلومات موثوقة حول التهديدات (Cyber Threat Intelligence - CTI) أمرًا بالغ الأهمية. يعتمد نجاح هذه العملية على القدرة على استخراج معلومات منظمة وغنية دلاليًا من سجلات أنظمة الأمان. إلا أن الأساليب التقليدية غالبًا ما تواجه صعوبة في التعرف على الأحداث الضارة وتفسيرها بدقة، خاصة في حالات السجلات غير المنظمة أو الغامضة.

في هذا السياق، نقدم منهجية مبتكرة تدمج بين الأنطولوجيات المدفوعة بالمجال ونماذج اللغة الضخمة (Large Language Models - LLMs)، لبناء وكيل ذكاء اصطناعي (Artificial Intelligence - AI) يعمل على تحسين دقة وشرح المعلومات المستخرجة من سجلات الأمن السيبراني.

تتمحور فكرتنا حول دمج الأنطولوجيات الخاصة بالمجال وقيود SHACL لتوجيه هيكل مخرجات نموذج اللغة وضمان صحة المعنى على الرسم البياني الناتج. يتم تنظيم المعلومات المستخرجة في قاعدة بيانات غنية بالأنطولوجيا، مما يتيح تحليلًا دلاليًا وسؤالاً مستقبليًا.

تصميم منهجيتنا مدفوع بالمتطلبات التحليلية المرتبطة ببيانات سجلات honeypots، التي غالبًا ما تتكون من نشاطات ضارة. على الرغم من أن الدراسة التجريبية تعتمد على مجموعات بيانات متاحة للجمهور، إلا أنها تظهر أن طريقتنا تحقق دقة أعلى في استخراج المعلومات مقارنة بالأساليب التقليدية المعتمدة على التوجيه فقط، مع التركيز المتعمد على جودة الاستخراج بدلًا من سرعة المعالجة.

ختامًا، تُظهر هذه المبادرة أهمية التعاون بين الذكاء الاصطناعي والبيانات غنية الدلالية، مما يعزز قدرة المؤسسات على مواجهة التهديدات السيبرانية بفعالية أكبر. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.