في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models - LLMs) مكونًا رئيسيًا داخل نظام تكنولوجيا المعلومات الذي تهيمن عليه تقنيات الذكاء الاصطناعي. ومع تزايد الاعتماد على هذه النماذج، تنمو المخاوف من مخاطر المخرجات الضارة أو تلك التي تنتهك السياسات الموضوعة. لذلك، تعتمد الأنظمة التجارية أساليب توافق متقدمة وآليات إشراف متعددة الطبقات على المحتوى.

ومع ذلك، أظهرت الأبحاث الحديثة أن نماذج اللغة الكبيرة لا تزال عرضة للتلاعب العدائي، وخاصة من خلال تقنيات الاختراق السجن (jailbreaking) وحقن التوجيه (prompt injection).

في دراسة جديدة، يقدم الباحثون تقنية GAS-Leak-LLM، التي تعتمد على خوارزمية جينية لتطوير هجوم اختراق للنماذج يستهدف تجاوز القيود الأمنية. تعمل هذه الطريقة في بيئة مغلقة (black-box)، مما يعني أنها لا تتطلب الوصول إلى معلمات النموذج أو البنى الداخلية له، مما يعكس سيناريوهات تهديد واقعية خصوصا في الأنظمة المفعلة.

تعتمد التقنية الجديدة على تطبيق تكراري لأساليب الاختيار، والطفرة، والتزاوج (crossover) لاستكشاف الفضاء التوجيهي بشكل منهجي لتحديد اللاحقات الضارة ذات الملاءة العالية. تكشف النتائج التجريبية عن عيوب حاسمة في الآليات الحالية لفرض الأمان، وتؤكد فعالية وجدوى الهجوم المقترح.

إن GAS-Leak-LLM يمثل خطوة مثيرة للاهتمام في ميدان الأمن السيبراني للذكاء الاصطناعي، حيث يسلط الضوء على ضرورة تحسين آليات الأمان لحماية أنظمة المعلومات من التهديدات المتزايدة.