في عالم متسارع يتجه نحو الاعتماد على نماذج اللغات الكبيرة (LLMs) لاكتشاف الثغرات الأمنية في الشيفرات، أظهرت الأبحاث الحديثة أن هذه النماذج ليست محصنة ضد المعايير الإدراكية التي تؤثر على حكم البشر. ولكن، لم يتم بعد دراسة كيفية تأثير هذه المعايير بشكل فعلي على تقييم النماذج للثغرات البرمجية.
في هذا السياق، قدم الباحثون أول استكشاف منهجي عن تأثير المعايير الإدراكية في اكتشاف ثغرات الكود المدعومة بواسطة نماذج الذكاء الاصطناعي. حيث ابتكروا إطار عمل محكمًا يُحافظ على ثبات الكود مع تغيير السياقات المحيطة لتحفيز ثلاثة من المعايير الإدراكية:
1. تأثير الهالة (Halo Effect) من خلال نسب التأليف.
2. تأثير الإطار (Framing Effect) من خلال أهداف ومخرجات المهام.
3. تأثير الربط (Anchoring Effect) من خلال نتائج التحليلات السابقة.
بهذا الإطار، تم تقييم ثمانية نماذج ML عبر ثلاث لغات برمجية، حيث أظهرت النتائج أن جميع النماذج المُقيمة كانت حساسة لهذه المعايير. وكانت أعلى نسبة قابلية لتأثير الإطار تصل إلى 33.2%، تليها نسبة التأثير المرتبطة بالربط عند 23.5%، وأخيرًا تأثير الهالة بنسبة 18.4%.
علاوةً على ذلك، كشفت التحليلات على مستوى الكود أن الثغرات التي تتطلب معالجة دلالية كانت أكثر عرضة للتأثيرات الإدراكية مقارنةً بتلك التي يمكن اكتشافها من خلال المطابقة النمطية.
الأمر الأكثر إثارة هو أن النماذج غالبًا ما تغيّر حكمها من "آمن" إلى "معرض للثغرات" بناءً على الوضع الإدراكي، مما يعني أن النماذج لا تتعرف بدقة على الثغرة الفعلية.
ولإبراز التأثير العملي لهذا الأمر، تم تقديم نموذج هجوم إدراكي يُظهر كيف يمكن تقليل اكتشاف الثغرات بنسبة تصل إلى 97%.
تشير هذه النتائج إلى أن القابلية للتأثر الإدراكي هي سمة ثابتة وقابلة للاستغلال في اكتشاف الثغرات المدعوم بنماذج الذكاء الاصطناعي. ما رأيكم في هذه التطورات؟ شاركونا آرائكم في التعليقات!
الكلمات تتحدث بصوت أعلى من الشيفرات: كيف تؤثر المعايير الإدراكية على اكتشاف ثغرات الكود في نماذج الذكاء الاصطناعي؟
استكشاف جديد يكشف عن تأثير المعايير الإدراكية على نماذج الذكاء الاصطناعي في اكتشاف ثغرات الكود. دراسة تحليلية تُظهر قابلية هذه النماذج للتأثر بالتأثيرات الإدراكية مثل تأثير الهالة وتأثير الإطار.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
