في عالم يتسارع فيه تطور الذكاء الاصطناعي، أصبحت نماذج اللغات الضخمة (Large Language Models) تعتمد بشكل متزايد على المهارات القابلة لإعادة الاستخدام. وهذه المهارات قد تتضمن مستندات توضح إجراءات محددة لأداء مهام معينة. ومع ذلك، فإن هذا التوجه يفتح الباب أمام نوع جديد من التهديدات والعيوب التي يجب على هذه الأنظمة إدارتها.

في دراسة جديدة، تم التركيز على اتجاهين مكملين لهذا التهديد. الأول يتعلق بالدفاعات المستندة إلى الأوصياء (guardians)؛ حيث تم تطوير وكيل نمذجي يعمل كوسيط للوصول إلى ملفات المهارات. يتميز هذا النظام بنوعين: "الأوصياء الديناميين" الذين يتدخلون في الوقت الحقيقي عند طلب الوصول، و"الأوصياء الثابتين" الذين يعيدون كتابة هذه الملفات في وقت البناء. أظهرت الدراسات أن هذه الدفاعات قللت معدل نجاح الهجمات بنسبة تفوق الخمسين بالمئة، مع الحفاظ على فعالية المهام.

أما الاتجاه الثاني، فهو اختبار قوة هذه الدفاعات من خلال إعادة صياغة الهجمات. حيث تم استخدام أربعة أنواع من الهجمات التي تحافظ على التعليمات الضارة ولكن تغير الصياغة. في حالة الإعدادات التي لا تتضمن الأوصياء، ارتفع معدل نجاح الهجمات إلى 81.4%، بينما انخفض هذا المعدل إلى 18.6% عند استخدام الوصي الديناميكي، مما يبرهن على فعالية التدخل الفوري.

بهذا، تبرز أهمية تطوير استراتيجيات دفاعية جديدة لحماية أنظمة الذكاء الاصطناعي من التهديدات المتزايدة. ما هي الطرق الأخرى التي تعتقد أنه يمكن استخدامها كدفاعات ضد هذه الهجمات؟ شاركونا في التعليقات.