في ظل ازدياد التهديدات السيبرانية، تبرز تساؤلات مهمة حول مدى قدرة نماذج اللغات الضخمة (LLMs) على تقديم حلول فعّالة لهذا المجال. أجريت دراسة جديدة تقيّم جاهزية هذه النماذج، من خلال الاعتماد على معيار مزدوج يشمل كشف الثغرات الأمنية في نماذج البرمجة (VulnLLM-R) واختبار أمان التطبيقات عبر الإنترنت.
تم اختبار عدة نماذج متقدمة، بما في ذلك GPT-5.4 وCodex~5.3 وClaude Opus~4.6. النتائج التي توصلنا إليها كانت مفاجئة:
1. أظهرت جميع النماذج نِسبًا من الإيجابيات الكاذبة تتراوح بين 10-50% عند محاولة كشف الثغرات.
2. في اختبارات التطبيقات، بلغت نسبة التغطية الحقيقية للنماذج 4-8%، حتى مع استخدام أدوات أمان خارجية تعزز هذه النسبة إلى 10-19%.
3. أظهرت نماذج متخصصة نتائج أفضل، حيث ارتفعت قدرتها على كشف الثغرات إلى أكثر من 50% بفضل منهجيات اختبارات اختراق منظمة.
4. حقق أحد النماذج الدفاعية المتخصصة أعلى دقة (0.904) وأدنى معدل للإيجابيات الكاذبة (9.7%).
تم تحديد نقص البيانات المنظمة لأختبارات الأمان كعائق أساسي في تدريب هذه النماذج، ودُعي للتوجه نحو تطوير استراتيجيات جديدة لتوليد البيانات، مثل اعتماد أسلوب “الاختبار الذاتي”.
تؤكد هذه الدراسة الحاجة الملحة لتطوير نماذج أساسية مصممة خصيصًا للأمان السيبراني، مما يسهم في تعزيز القدرة على مواجهة التهديدات التي يواجهها العالم الرقمي اليوم. ما هي وجهة نظركم حول مستقبل الأمن في عصر الذكاء الاصطناعي؟ شاركونا في التعليقات!
هل نماذج اللغات الضخمة جاهزة لمواجهة التهديدات السيبرانية؟ اكتشافات مثيرة حول أمان التطبيقات!
تظهر الأبحاث الجديدة أن نماذج اللغات الضخمة (LLMs) تواجه تحديات كبيرة في كشف الثغرات الأمنية. نتائج الاختبار تكشف عن نسبة إيجابية كاذبة مرتفعة، مما يستدعي تطوير نماذج متخصصة في الأمن السيبراني.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
