في عالم البرمجيات الحديث، تلعب عملية تسجيل البيانات (Logging) دورًا حيويًا من خلال توثيق الأحداث والسلوكيات الرئيسية التي تساهم في تصحيح الأخطاء ومراقبة الأنظمة. ومع ذلك، قد تؤدي ممارسات التسجيل غير الآمنة إلى كشف معلومات حساسة أو تيسير عمليات الهجوم مثل حقن السجلات، مما يعرض أمان النظام وخصوصيته للخطر.

تشير الأبحاث السابقة إلى أن معظم الدراسات ركزت على عيوب عامة في التعليمات البرمجية الخاصة بالتسجيل، لكن التحليل النظامي لمشكلات الأمان المتعلقة بتلك التعليمات البرمجية لا يزال محدودًا، خاصة في استخدام نماذج اللغات الضخمة (LLMs) للكشف عن هذه المشكلات وإصلاحها.

لتلبية هذه الحاجة، قام الباحثون بتطوير تصنيف شامل لمشكلات أمان التعليمات البرمجية للتسجيل، والذي يتضمن أربع فئات شائعة مع عشرة أنماط مرتبطة بها. كما تم إنشاء مجموعة بيانات مرجعية تحتوي على 101 تقرير عن مشكلات أمان حقيقية تم مراجعتها يدوياً.

بعد ذلك، اقترحوا إطارًا آليًا يجمع بين المعرفة السياقية المختلفة لتقييم قدرات نماذج اللغات الضخمة (LLMs) في الكشف عن مشكلات الأمان وإصلاحها. كشفت النتائج التجريبية عن تفاوت ملحوظ في الأداء؛ حيث أن النماذج كانت فعّالة إلى حد ما في الكشف عن المشكلات الأمنية، مع دقة تتراوح بين 12.9% و52.5% في المتوسط، ولكنها واجهت تحديات كبيرة في توليد إصلاحات البرمجة الصحيحة بشكل موثوق.

من اللافت للنظر أن تحسين دقة اكتشاف المشكلات كانت أكبر عند استخدام وصف المشكلة فقط مقارنةً بشرح نمط الأمان أو الجمع بين الجانبين. يقدم هذا البحث رؤى عملية للممارسين، ويسلط الضوء على الإمكانيات والقيود الحالية لنماذج اللغات الضخمة فيما يتعلق بتسجيل البيانات الآمن.